24
Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves Introdução Método - é um meio mais eficaz para atingir determinada meta. Métodos Científicos - destacamos o método experimental e o método estatístico. Método Experimental - consiste em manter constante todas as causas, menos uma, que sofre variação para se observar seus efeitos, caso existam. Ex: Estudos da Química, Física, etc. Método Estatístico - diante da impossibilidade de manter as causas constantes (nas ciências sociais), admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Ex: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui? Seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumidores, nível geral de preços de outros produtos, etc. ESTATÍSTICA: É uma parte da matemática aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A coleta, a organização, a descrição dos dados e o cálculo de coeficientes pertencem à Estatística Descritiva, enquanto a análise e a interpretação dos dados, ficam a cargo da Estatística Indutiva ou Inferencial. Fases do Método Estatístico Definição do Problema: Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema. Planejamento: Como levantar informações ? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de atividades ? Os custos envolvidos ? etc. Coleta de Dados: Fase operacional. É o registro sistemático de dados, com um objetivo determinado. Dados primários: quando são publicados pela própria pessoa ou organização que os haja recolhido. Ex: tabelas do censo demográfico do IBGE. Dados secundários: quando são publicados por outra organização. Ex:quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE. OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco de erros de transcrição.

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Embed Size (px)

Citation preview

Page 1: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Introdução

Método - é um meio mais eficaz para atingir determinada meta. Métodos Científicos - destacamos o método experimental e o método estatístico. Método Experimental - consiste em manter constante todas as causas, menos uma, que sofre variação para se observar seus efeitos, caso existam. Ex: Estudos da Química, Física, etc. Método Estatístico - diante da impossibilidade de manter as causas constantes (nas ciências sociais), admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Ex: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui? Seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumidores, nível geral de preços de outros produtos, etc. ESTATÍSTICA: É uma parte da matemática aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.

A coleta, a organização, a descrição dos dados e o cálculo de coeficientes pertencem à Estatística Descritiva, enquanto a análise e a interpretação dos dados, ficam a cargo da Estatística Indutiva ou Inferencial.

Fases do Método Estatístico

• Definição do Problema: Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema.

• Planejamento: Como levantar informações ? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de atividades ? Os custos envolvidos ? etc.

• Coleta de Dados: Fase operacional. É o registro sistemático de dados, com um objetivo determinado.

Dados primários: quando são publicados pela própria pessoa ou organização que os haja recolhido. Ex: tabelas do censo demográfico do IBGE. Dados secundários: quando são publicados por outra organização. Ex:quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE. OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco de erros de transcrição.

Page 2: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca.

coleta contínua: registros de nascimento, óbitos, casamentos; coleta periódica: recenseamento demográfico, censo industrial; coleta ocasional: registro de casos de dengue.

Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliação,indícios ou proporcionalização

• Apuração dos Dados: Resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados.

• Apresentação dos Dados: Há duas formas de apresentação, que não se excluem mutuamente. A apresentação tabular e a apresentação gráfica.

• Análise e Interpretação dos Dados: A última fase do trabalho estatístico e a mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva).

Definições Básicas

Fenômeno Estatístico: é qualquer evento que se pretenda analisar, cujo estudo seja possível a aplicação do método estatístico. Dado Estatístico: é um dado numérico no qual iremos aplicar os métodos estatísticos. População: é o conjunto total de elementos portadores de, pelo menos, uma característica comum. Amostra: é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a essa população. Parâmetros: São valores singulares que existem na população e que servem para caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. Ex: Os alunos da Faculdade X têm em média 1,70 metros de estatura. Estimativa: é um valor aproximado do parâmetro e é calculado com o uso da amostra. Atributo: quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo.

Page 3: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves Variável: É o conjunto de resultados possíveis de um fenômeno.

Variável Qualitativa: Quando seu valores são expressos por atributos: sexo, cor da pele,etc.

Variável Quantitativa: Quando os dados são de caráter nitidamente quantitativo , e o conjunto dos resultados possui uma estrutura numérica, trata-se portanto da estatística de variável e se dividem em :

• Variável Discreta ou Descontínua: Seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens.

• Variável Contínua: Resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites.

Page 4: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Amostragem

Estudo das relações existentes entre a população e a amostra Amostragem Aleatória Simples - É o processo mais elementar e frequentemente utilizado. É equivalente a um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, x números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra. Ex: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola: 1º - numeramos os alunos de 1 a 90. 2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e após mistura retiramos, um a um, nove números que formarão a amostra. Amostragem Aleatória Estratificada - Quando a população se divide em estratos (sub-populações), convém que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos. Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São portanto dois estratos (sexo masculino e sexo feminino). Logo, temos:

Sexo População 10% Amostra Masculino 54 5,4 5 Feminino 36 3,6 4 Total 90 9,0 9

Amostragem Sistemática - Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prédios de uma rua, as linhas de produção etc. Amostra por Conglomerados – Divide-se a população seções ou conglomerados (estes conglomerados devem ser miniaturas da população). Um dos conglomerados deve ser amostrado aleatoriamente.

Page 5: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Séries Estatísticas

Tabela: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. • De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar : - um traço horizontal ( - ) quando o valor é zero; - três pontos ( ... ) quando não temos os dados; - zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; - um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor. OBS.: O lado direito e esquerdo de uma tabela oficial deve ser aberto.. Série Estatística: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. a) Série Temporal: Identifica-se pelo caráter variável do fator cronológico. O local e a espécie (fenômeno) são elementos fixos. Esta série também é chamada de histórica ou evolutiva. b) Série Geográfica: Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização. c) Série Específica: O caráter variável é apenas o fato ou espécie. Também é chamada de série categórica. Séries Conjugadas: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica-temporal.

Page 6: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Gráficos Estatísticos

São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir as tabelas estatísticas. Características: Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade. Gráficos em linhas: São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. Quando representamos, em um mesmo sistema de coordenadas, a variação de dois fenômenos, a parte interna da figura formada pelos gráficos desses fenômenos é denominada de área de excesso. Gráficos em barras: Quando as legendas não são breves usa-se de preferência os gráficos em barras horizontais. Nesses gráficos os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. - A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se for geográfica ou categórica. Gráficos em colunas:Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. Gráficos em setores: Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. OBS.: As séries temporais geralmente não são representadas por este tipo de gráfico. Pictogramas: São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser autoexplicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos.

Page 7: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Gráfico em linhas Gráfico em barras

Gráfico em colunas Gráfico em setores

Pictograma

Figura 1: Exemplo de Gráficos

Page 8: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Distribuição de Frequência

É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores). Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex:45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 10 ROL: É uma seqüência ordenada dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42, 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Distribuição de frequência SEM INTERVALOS DE CLASSE: É a simples condensação dos dados conforme as repetições de seu valores. Para um ROL de tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Veja exemplo abaixo: Dados 41 42 43 44 45 46 50 51 52 54 57 58 60 Total Frequência 3 2 1 1 1 2 2 1 1 1 1 2 2 20 Distribuição de frequência COM INTERVALOS DE CLASSE: Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores em vários intervalos de classe.

Elementos de uma Distribuição de Frequência (com intervalos de classe)

Classe: são os intervalos de variação da variável e é simbolizada por i e o número total de classes simbolizada por k calculado através da fórmula nk = . Ex.: (k = 5). Amplitude Total da Amostra: é a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde (min)(max) xxA −= . Ex.: 194160 =−=A .

Amplitude de Classe: é obtida através da razão entre a Amplitude Total e diferença

entre o limite superior e inferior da classe e é simbolizada por )1( −

=K

AC . c = 4,75

Obs: Na distribuição de frequência com classe o c será igual em todas as classes.

Limites de Classe: são os extremos de cada classe. 21ª1

cxLI −= e o cLILS += 1ª1

sendo ª1ª2 LSLI = , etc. Logo 63,3838,241ª1 =−=LI e 38,4375,463,38ª1 =+=LS ... O símbolo |------- representa um intervalo fechado à esquerda e aberto à direita.

Page 9: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves Amplitude Total da Distribuição: é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. (min)(max) LLAT −= . Ex.: 204161 =−=AT .

Ponto Médio de Classe: é o ponto que divide o intervalo de classe em duas partes

iguais. .Ex: em 48,13|------- 52,88 o ponto médio 51,502

88,5213,483 =+=x .

Classes Frequências 38,63|------- 43,38 6 43,38|------- 48,13 4 48,13|------- 52,88 4 52,88|------- 57,63 2 57,63|------- 62,38 4 Total 20

Representação Gráfica e Tabular de uma Distribuição Histograma, Polígono de frequência e Polígono de frequência acumulada Em todos os gráficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da variável e na linha vertical (eixo das ordenadas), as frequências. Histograma: é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das frequências simples ou absolutas. Frequências simples ou absoluta: são os valores que realmente representam o número de dados de cada classe. A soma das frequências simples é igual ao número total dos dados da distribuição. Frequências relativas: são os valores das razões entre as frequência absolutas de cada classe e a freqüência total da distribuição. A soma das frequências relativas é igual a 1 (100 %). Polígono de Frequência: é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos

Page 10: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Polígono de Frequência Acumulada: é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Frequência Simples Acumulada de uma classe: é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. Frequência Relativa Acumulada de um classe: é a frequência acumulada da classe, dividida pela frequência total da distribuição.

Classes if ix rif iF riF 50|------- 54 4 52 0,100 4 0,100 54|------- 58 9 56 0,225 13 0,325 58|------- 62 11 60 0,275 24 0,600 62|------- 66 8 64 0,200 32 0,800 66|------- 70 5 68 0,125 37 0,925 70|------- 74 3 72 0,075 40 1,000

Total 40 - 1,000 - - Onde: if = frequência simples, ix = ponto médio de classe, rif = frequência relativa, iF = frequência simples acumulada, riF = frequência relativa acumulada.

Page 11: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Medidas de Posição

São estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal (eixo das abcissas). As mais importantes das medidas de posição são as medidas de tendência central, as quais recebem tal denominação pelo fato dos dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central destacamos:

• a média; • a mediana; • a moda.

Média – É o quociente da divisão da soma dos valores da variável pelo número dele.

Cálculo para dados não/agrupados Cálculo para dados agrupados

∑=−

n

xx i ∑=

n

xfx ii

Mediana – Dados um conjunto de dados ordenados, é o valor central desse conjunto de valores. Cálculo para dados não/agrupados:

Se n é ímpar Se n é par xMd =

2

xxMd

+=

Cálculo para dados agrupados (Sem intervalo de classe) A mediana é obtida dividindo o número de observações por dois. Em seguida, analisar a menor reqüência acumulada que supera este valor; buscar o valor da variável correspondente a tal. Cálculo para dados agrupados (Com intervalo de classe)

• Determinamos as reqüências acumuladas; • Dividimos o número de observações por 2; • Marcamos a classe mediana e empregamos a fórmula:

−+= Md

Md

a

Md CF

Fn

LIMd .2

Onde: MdLI = é o limite inferior da classe mediana;

Page 12: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

aF = é a freqüência acumulada da classe anterior à classe mediana;

MdF = é a freqüência simples da classe mediana;

MdC = é a amplitude do intervalo da classe mediana. Moda – É a realização mais freqüente entre os valores observados.

Cálculo para dados não/agrupados: Para um determinado conjunto, usa-se o valor com maior que mais se repete.

Cálculo para dados agrupados (Com intervalo de classe) Método de Czuber

MoMo CLIMo .21

1

∆+∆∆+=

Onde: MoLI = é o limite inferior da classe modal;

1∆ = é a diferença entre as frequências da classe modal e a classe imediatamente anterior;

2∆ = é a diferença entre as frequências da classe modal e a classe imediatamente posterior;

MdC = é a amplitude do intervalo da classe modal.

Page 13: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Medidas de Dispersão

Grandeza numérica que descreve um conjunto de dados, pela quantificação da variabilidade ou heterogeneidade neles presentes. Amplitude Total – Corresponde à diferença do maior para o menor valor do conjunto.

Sem intervalo de classe Com intervalo de classe (min)(max) xxAT −= (min)(max) LLAT −=

Variância e Desvio Padrão – Para variância populacional usamos 2σ e para

variância amostral 2S ; σ e S para desvio padrão populacional e amostral Para o cálculo da variância para população finita, devemos utilizar as seguintes expressões:

Cálculo para dados não/agrupados:

( )

−= ∑ ∑

N

xx

Ni

i

2

22 1σ População

( )

−= ∑ ∑

n

xx

nS i

i

2

22

1

1 Amostra

Cálculo para dados agrupados:

( )

−= ∑ ∑

n

fxfx

nS ii

ii

2

22

1

1

Temos que o desvio padrão é dado pela raiz quadrada da variância.

2σσ = - população

2SS = - amostra

Coeficiente de Variação – Caracteriza a variabilidade dos dados em termos relativos o seu valor médio. Onde:

100.−=X

SCV

Erro Padrão da Média – Mede a variabilidade com que a média foi estimada. Da idéia de precisão com que a média foi calculada. É obtido por:

n

SS

x=−

Page 14: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Introdução à Teoria da Probabilidade

Definições:

• Um evento é qualquer conjunto de resultados de um experimento. • Um evento simples é o resultado mais simples de um experimento. • O espaço amostral de um experimento é o conjunto de todos os eventos

simples possíveis. Se A é um evento, P(A) é a probabilidade de ocorrer o evento A Aproximação da Probabilidade pela Frequência Relativa:

P(A) = número de vezes que ocorreu A número de vezes que o procedimento foi repetido

Aproximação da Probabilidade para eventos simples igualmente prováveis:

P(A) = número de maneiras que A pode ocorrer número de diferentes eventos simples

Para qualquer evento A, 1)(0 ≤≤ AP .

O complementar de um evento A, representado por_

A, é o conjunto de todos os

resultados onde A não ocorre. Logo: 1)()(_

=+ APAP Dica: A probabilidade de “pelo menos um” é 1 – a probabilidade de “nenhum”, isto é: P(pelo menos um) = 1 – P(nenhum). Regra da Adição (OU).

)()()()()()()()( BAPBPAPBAPAeBPBPAPAouB ∩−+=∪⇔−+=

Se A e B são disjuntos, então 0)( =∩ BAP . Assim, para A e B disjuntos

)()()( BPAPAouBP += .

Page 15: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves Regra da Multiplicação (E). A probabilidade condicional )\( ABP é a probabilidade da ocorrência do evento B, dado que o evento A já ocorreu. Lembre-se que )\()\( BAPABP ≠

P(A e B) )\().( ABPAP=

Se A e B são independentes (isto é, a ocorrência de um não afeta a ocorrência do outro), então: P(A e B) = P(A) . P(B) Regra da Permutação Simples. Um conjunto de n diferentes itens pode ser organizado em ordem de n! maneiras diferentes. Ou seja: !nPn = Regra da Permutação ou Arranjo

1. Quando há um total de n diferentes itens entre si; 2. Selecionamos r dos n itens (sem reposição); 3. Temos que organizar as sequências de forma diferente (isto é, ABC# CBA).

O número de permutações (arranjos) de r itens selecionados (sem reposição) dentre

os n itens disponíveis é: )!(

!, rn

nP rn −

= .

Regra da Permutação Composta Quando há n itens disponíveis e 1n iguais entre si 2n iguais entre si, ... , kn iguais

entre si; o número de permutações de todos os n itens selecionados é: !!...!

!

21 knnn

nP = .

Regra da Combinação

1. Quando há um total de n diferentes itens entre si; 2. Selecionamos r dos n itens (sem reposição); 3. Temos que organizar as sequências de forma diferente (isto é, ABC=CBA).

O número de combinações de r itens selecionados (sem preposição) dentre os n

itens disponíveis é:

=−

=n

rrn rrn

nC

!)!(

!, .

Page 16: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Distribuição Discretas de Probabilidades

Definições:

• Uma variável aleatória (v.a) é uma variável (representada por x) que possui um único valor numérico, determinado pelo acaso, para cada resultado de um experimento

• Uma distribuição de probabilidade é uma descrição da probabilidade para cada valor da variável aleatória.

• Uma variável aleatória discreta tem um número finito de valores ou uma quantidade enumerável de valores

• Uma variável aleatória contínua tem infinitos valores que podem ser associados com medidas em uma escala contínua, sem pulos ou interrupções.

Exemplos: O número de alunos de estatística é uma variável aleatória discreta, pois é representado por números inteiros. A medida de tensão de uma bateria é uma variável aleatória contínua pois ela pode assumir qualquer valor de um intervalo de 0 volts a 12 volts (como 5,675 volts). Requisitos para uma Distribuição de Probabilidade

1. A soma de todas as probabilidades deve ser 1, isto é: ∑ = 1)(xP .

2. Para cada valor da v.a. x, temos: 1)(0 ≤≤ xP . Média, Variância e Desvio Padrão de uma Distribuição de Probabilidade. Média: [ ]∑= )(. xPxµ Variância: ( )[ ] [ ] 2222 )(.)( µµσ −=−−=∑ ∑ xPxxPx Desvio Padrão: [ ]∑ −= 22 )(. µσ xPx

Distribuição de Probabilidade Binomial Uma distribuição de probabilidade binomial resulta de um experimento que satisfaz os seguintes requisitos:

1. O experimento tem um número fixo de tentativas; 2. As tentativas são independentes; 3. Cada tentativa tem todos os resultados classificados em duas categorias

(geralmente sucesso e fracasso); 4. A probabilidade de um sucesso permanecer constante em todas as

tentativas.

Page 17: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

A fórmula da Probabilidade Binomial é: xnx qpxnx

nxP −

−= ..

)!(!

!)( , onde

n = número de tentativas; x = número de sucessos em n tentativas; p = probabilidade de sucesso em qualquer tentativa; q = probabilidade de fracasso em qualquer tentativa (q = 1 – p). Para calcular a probabilidade binomial podemos utilizar a fórmula ou utilizar uma tabela de probabilidades binomiais, localizando inicialmente n e depois o valor de x desejado juntamente com o valor de p (sucesso). Exemplo: Use a tabela ou a fórmula da probabilidade binomial para encontrar a probabilidade de se obter exatamente 7 jurados latinoamericanos quando 12 jurados são selecionados aleatoriamente de uma população composta por 80% de latinoamericanos. Calcule também a probabilidade de 7 ou menos jurados. Resolução: Usando a tabela, para n = 12, x = 7 e p = 0,8, a probabilidade é dada por P(7) = 0,053 Usando a fórmula da probabilidade binomial, temos:

0531502203,000032,0.2097152,0.

!5!7

!122,0.8,0.

)!712(!7

!12)7( 7127 ==

−= −P

Para calcular a probabilidade de 7 ou menos, devemos obter :

P(7 ou menos)=P(7 ou 6 ou 5 ou 4 ou 3 ou 2 ou 1 ou 0)= P(7 ou menos)= P(7) + P(6) + P(5) + P(4) + P(3) + P(2)+ P(1) + P(0)=

0,053 + 0,016 + 0,003 + 0,001 + 0 + 0 + 0 + 0 = 0,073 Assim, a probabilidade de escolher 7 ou menos jurados é 7,3%. Média, Variância e Desvio Padrão de uma Distribuição Binomial Média: np=µ Variância: npq=2σ Desvio Padrão: npq=σ Exemplo: Considerando a mesma situação do exemplo anterior, calcule a média e o desvio padrão. Resolução: usando os valores para n = 12, p = 0,8 e q = 0,2, temos:

6,9)8,0)(12( === npµ 38,192,1)2,0)(8,0)(12( ≈=== npqσ

Page 18: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Distribuição de Probabilidade de Poisson A distribuição de probabilidade de Poisson é uma distribuição de probabilidade discreta que se aplica a ocorrências de eventos ao longo de intervalos especificados. A v.a. x é o número de ocorrências do evento no intervalo (que pode ser tempo, distância, etc.). A probabilidade de ocorrência do evento x vezes em um intervalo é dada por:

!

.)(

x

exP

x µµ −

= , onde 71828,2≈e .

Requisitos da Distribuição de Poisson

• A v.a x é o número de ocorrências de um evento ao longo de algum intervalo; • As ocorrências devem ser aleatórias, independentes uma das outras e

uniformemente distribuídas sobre o intervalo em uso. Parâmetros da Distribuição de Poisson A média é µ e o desvio padrão é µσ = . Exemplo: Ao analisar os impactos das bombas V – 1 na 2ª Guerra Mundial, o sul de Londres foi subdividido em 576 regiões, cada uma com 0,25 Km² de área. Um total de 535 bombas caiu na área combinada das 576 regiões. Se uma região é selecionada aleatoriamente, ache a probabilidade de ela ter sido bombardeada exatamente 2 vezes. A partir desta probabilidade encontrada, quantas das 576 regiões espera que sejam atingidas exatamente duas vezes? Resolução: A distribuição de Poisson se aplica porque estamos lidando com as ocorrências de um evento (impacto de bombas) sobre algum intervalo (uma região com 0,25 Km² de área). O número médio de impactos por região é:

µ= número de impactos de bombas = 535 = 0,929. número de regiões 576

Como desejamos a probabilidade de exatamente dois impactos em uma região, fazemos x = 2 na fórmula da distribuição de Poisson. Logo:

170,02

395,0.863,0

!2

.)929,0()2(

!

.)(

929,02

===⇒=−− e

Px

exP

x µµ .

Assim, a probabilidade de uma região selecionada aleatoriamente ser atingida exatamente duas vezes é P(2) = 0,170. E dentre as 576 regiões, o número de regiões

Page 19: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves que espera-se ser atingida exatamente duas vezes equivale a 989,97170,0.576 ≈= regiões.

Distribuições Contínuas de Probabilidades

Distribuição Uniforme Uma v.a contínua tem uma distribuição uniforme se seus valores se espalham uniformemente sobre a faixa de valores possíveis. O gráfico (ou curva de densidade) de uma distribuição uniforme resulta em uma forma retangular. Em uma distribuição de probabilidade contínua, uma curva de densidade possui uma área total sobre a curva igual a 1 e cada ponto da curva tem uma altura maior ou igual a 0 (isto é, a curva não possui valores negativos). Como a área total sob a curva de densidade é igual a 1, existe uma correspondência entre área e probabilidade.

Distribuição Normal A distribuição normal é a distribuição de probabilidade de uma v.a. contínua

descrita pela fórmula πσ

σµ

2

2

2

1

−−

=

x

ey . O gráfico da distribuição normal é simétrico em

relação a média µ e tem forma de sino. A distribuição normal padrão é uma distribuição de probabilidade normal com média µ=0 e desvio padrão σ=1, e área sob a curva de densidade é 1. Para calcular a probabilidade (área) da curva de uma distribuição de probabilidade normal padrão (com média µ=0 e desvio padrão σ=1), pode utilizar a tabela de valores da área acumulada, que mostra o valor da área acumulada a partir da esquerda até uma reta vertical sobre um valor específico do escore z. Lembrando que o escore z é a distância na escala horizontal do gráfico (apresentado na coluna à esquerda e na linha do topo da tabela) e a área é a região sob a curva (que são valores contidos no corpo da tabela). Em uma distribuição de probabilidade contínua (como a distribuição normal) a probabilidade de se obter qualquer valor exato é 0, ou seja, P(z = α) = 0. Podemos identificar isso na curva de densidade, pois para qualquer ponto isolado na escala horizontal a região sob a curva é representado por uma linha reta vertical que não possui qualquer área. Daí para v.a. contínua calculamos a probabilidade para um intervalo e não para um ponto (como na v.a. discreta). Exemplo: Seja um experimento que possui uma distribuição normal padrão (com média µ=0 e desvio padrão σ=1). Calcule a probabilidade para:

Page 20: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

a) z menor que 1,58 b) z maior que -1,23 c) z entre -2,00 e 1,50

Resolução:

a) Para encontrar a probabilidade de z menor que 1,58 basta encontrar na tabela o valor da área acumulada a partir da esquerda até z = 1,58. Da tabela vemos que P(z < 1,58) = 0,9429

b) Para encontrar a probabilidade de z maior que -1,23;, devemos buscar na tabela o valor da área acumulada a partir da esquerda até z = -1,23 e depois calcularmos )23,1(1)23,1( −<−=−≥ zPzP , que corresponde à direita do gráfico. Da tabela vemos que P(z < -1,23) = 0,1093. Logo

8907,0)23,1( =−≥zP c) Para encontrar a probabilidade de z entre -2,00 e 1,50; devemos buscar na

tabela o valor da área acumulada a partir da esquerda até z = -2,00 e o valor da área acumulada a partir da esquerda até z = 1,50 e depois

calcularmos 9104,00228,09332,0)50,100,2( =−=≤≤− zP . Para encontrarmos um escore z a partir de uma área conhecida (que é a operação inversa), devemos identificar a região da curva que corresponde à probabilidade (área) dada, fazer as operações algébricas necessárias considerando a tabela que apresenta os valores da área acumulada a partir da esquerda até uma reta vertical sobre um valor específico do escore z, localizar a probabilidade mais próxima no corpo da tabela e identificar o escore z correspondente. Exemplo: Seja um experimento que possui uma distribuição normal padrão (com média µ = 0 e desvio σ = 1). Calcule o escore z que representa o 95% percentil 95P , isto é, o escore z que separa os 95% inferiores dos 5% superiores. Resolução: Neste caso devemos obter o valor do escore z que possui uma área de 0,95. Na tabela podemos encontrar os valores de 0,9495 e 0,9505 (com os escores z =1,64 e z=1,65; respectivamente), no entanto há uma observação indicando que 0,9500 corresponde ao escore z =1,645. Logo, o escore que representa o 95º percentil é z=1,645. Em muitas situações reais a distribuição normal não é a padrão (com média µ = 0 e desvio σ = 1). Para trabalharmos com distribuições normais não padronizadas

devemos converter de µ e σ através da fórmula σ

µ−= xz .Assim, para encontrarmos

área com a distribuição normal não padronizada devemos:

Page 21: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

1. Esboçar a curva normal, definindo a média µ e específicos de x identificando a região que representa a probabilidade desejada;

2. Para cada valor de x especificado, converter para o seu escore z

equivalente (através da fórmula σ

µ−= xz );

3. Consultar a tabela a área da região sombreada equivalente, como se fosse uma distribuição normal padrão. A área encontrada é equivalente à área da curva da distribuição normal não padronizada.

Para encontrar um valor de x a partir de uma área conhecida (operação inversa), o procedimento é semelhante ao da distribuição normal padrão, porém ao encontrar o valor do escore z na tabela, fazemos a conversão encontrando x através da fórmula x =µ+(z .σ). Exemplo: Seja um experimento que possui uma distribuição normal com média µ=

172 e desvio padrão σ = 29. Calcule a probabilidade para 174≤x . Resolução: A região que representa a probabilidade desejada é a área sob a curva normal( com média µ= 172 e desvio padrão σ = 29) acumulada a partir da esquerda até uma reta vertical com x =174. Convertendo x = 174 para um escore z obteremos

07,029

172174 =−=⇒−= z

xz

σµ .Na tabela podemos encontrar 5279,0)07,0( =≤zP .

Logo, para uma distribuição normal com média µ= 172 e desvio padrão σ = 29, a probabilidade para 174≤x é 5279,0)174( =≤xP . A Distribuição Normal como aproximação da Distribuição Binomial Se uma distribuição binomial satisfaz as exigências de 5≥np e 5≥nq , então a distribuição de probabilidade binomial pode ser aproximada por uma distribuição normal com média e desvio padrão e com os números inteiros discretos x ajustados pela correção de continuidade, de modo que x é representado pelo intervalo de (x –0,5) a (x+0,5). Quando usamos a distribuição normal (que é uma distribuição de probabilidade contínua) com aproximação da distribuição binomial (que é uma distribuição de probabilidade discreta), é feita uma correção de continuidade para o número inteiro x na distribuição binomial, representando-se o único valor de x pelo intervalo de (x –0,5) a (x+0,5). Exemplo: Aplicando a correção da continuidade na distribuição binomial para x=122, obteremos a probabilidade P(x) na distribuição normal da seguinte forma:

Page 22: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves Distribuição Binomial Distribuição Normal Pelo menos 122 (isto é, )122( ≥xP ) À direita de 121,5 (isto é, )5,121( ≥xP ) Mais de 122 ( isto é, )122( >xP ) À direita de 122,5 (isto é, )5,122( ≥xP ) No máximo 122 (isto é, )122( ≤xP ) À esquerda de 122,5 (isto é, )5,122( ≤xP ) Menos de 122 (isto é, )122( <xP ) À esquerda de 121,5 (isto é, )5,121( ≤xP ) Exatamente 122 (isto é, )122( =xP ) Entre 121,5 e 122,5 (isto é, )5,1225,121( ≤≤ xP ) Exemplo: Uma pesquisa recente mostrou que entre 2013 adultos selecionados aleatoriamente, 1358 (ou 67,5%) afirmaram ser usuários da Internet. Se a proporção de todos os adultos que usam a Internet for realmente 2/3, encontre a probabilidade de que uma amostra aleatória de 2013 adultos resulte em exatamente 1358 usuários da Internet. Resolução: Temos n = 2013 sujeitos da pesquisa, x = 1358 dos quais são usuários da Internet e supondo que a proporção populacional seja de p = 2/3 e q = 1/3. Vamos utilizar a distribuição normal para aproximar a distribuição binomial. Primeiramente, começamos verificando se a aproximação é adequada:

513423/2.2013 ≥==np e 56713/1.2013 ≥==nq . Agora vamos determinar os valores de µ e σ necessários para a distribuição normal.

13423/2.2013 === npµ 150256,21)3/1).(3/2.(2013 ==npqσ

Fazendo a correção de continuidade para obter a probabilidade exatamente de x=1358 usuários (isto é, )1358( =xP ) corresponde a encontrada na região da curva de distribuição normal a área que representa a probabilidade entre o intervalo 1357,5 e 1358,5 (isto é, )5,13585,1357( ≤≤ xP ). Utilizando a conversão para a distribuição normal padrão, obtemos os escores )78,073,0( ≤≤ zz e calculando a probabilidade utilizando a tabela da distribuição normal acumulada, obtemos:

0150,07673,07823,0)73,0()78,0()78,073,0( =−=≤−≤=≤≤ zPzPzP . Logo a probabilidade de que uma amostra aleatória de 2013 adultos resulte em exatamente 1358 usuários da internet é de 0,0150.

Page 23: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves

Correlação e Regressão

Definições:

• Dizemos que existe uma correlação entre duas variáveis quando uma delas está relacionada com a outra de alguma forma.

• O coeficiente de correlação linear r (ou coeficiente de correlação do produto de momentos de Pearson) mede a intensidade da relação linear entre os valores quantitativos emparelhados x e y em uma amostra. Seu valor é obtido através da fórmula:

∑ ∑ ∑ ∑

∑ ∑ ∑−

−=

2222 ))((.)()(

))(()(

yynxxn

yxxynr

• Dada uma coleção de dados amostrais emparelhados, a equação de regressão

definida por xbby 10

^

+= , onde

( )( ) ( )( )( ) ( )22

2

0

..

∑∑∑∑∑∑

−=

xxn

xyxxyb e

( ) ( )( )( ) ( )221

.

∑∑∑∑∑

−=

xxn

yxxynb ,

descreve algebricamente a relação entre as duas variáveis. O gráfico da equação de regressão é chamado de reta de regressão (ou reta de melhor ajuste, ou reta de mínimos quadrados).

Através da fórmula do coeficiente de correlação linear, o valor de r deve sempre estar entre -1 e + 1. Se r estiver muito próximo de 0, concluímos que não há uma correlação linear significativa entre x e y, mas se r estiver muito próximo de -1 (ou de +1), concluímos que há uma correlação linear negativa (ou positiva) entre x e y. Um estudo do gráfico de dispersão entre x e y deve confirmar que os pontos (x e y) se aproximam do padrão de uma reta (decrescente para r próximo de -1 e crescente para r próximo de +1). Exemplo: Utilizando uma amostra aleatória simples apresentada na tabela abaixo, encontre:

a. O valor do coeficiente de correlação linear r; b. A equação de regressão; c. A melhor previsão para y considerando x=6.

x 3 1 3 5 y 5 8 6 4

Page 24: Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia ...estudopsicologia.weebly.com/uploads/2/3/4/5/23456350/_estatisca... · dos mesmos na tomada de decisões. A coleta, a organização,

Faculdade Pitágoras / Divinópolis-MG Curso: Psicologia Disciplina: Estatística Aplicada à Psicologia Professora: Ana Paula Gonçalves Resolução: Antes de efetuar diretamente o cálculo de r e da equação de regressão, vamos utilizar uma tabela para facilitar a identificação de cada termo da fórmula.

x y x.y x² y² 3 5 15 9 25 1 8 8 1 64 3 6 18 9 36 5 4 20 25 16 Soma Σ 12 23 61 44 141

a) Utilizando os valores das somas obtidos na tabela e considerando n=4,

obtemos:

∑ ∑ ∑ ∑

∑ ∑ ∑−

−=

2222 ))((.)()(

))(()(

yynxxn

yxxynr

( ) ( )( )( ) ( ) ( ) ( )

956,035.32

32

231414.12444

23.12614

22−=−=

−−

−=r

Podemos perceber que existe uma correlação linear negativa entre x e y. b) Utilizando os valores das somas obtidos na tabela e considerando n=4,

obtemos:

( )( ) ( )( )( ) ( )

( )( ) ( )( )( ) ( ) 75,8

32

280

12444

61.1244.23..222

2

0 ==−−=

−=

∑∑∑∑∑∑

xxn

xyxxyb

( ) ( )( )( ) ( )

( ) ( )( )( ) ( ) 1

32

32

12444

23.12614.2221 −=−=

−−=

−=

∑∑∑∑∑xxn

yxxynb

Assim, obtemos a equação de regressão xxbby −=+= 75,810

^

c) Utilizando a equação de regressão xy −= 75,8^

, e considerando x=6, obtemos

a melhor previsão para y como sendo 75,2675,875,8^

=−=−= xy .