68
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CÂMPUS DE CAMPO MOURÃO APOSTILA DE ESTATÍSTICA APLICADA PARA O CURSO DE TECNOLOGIA EM ALIMENTOS Professor: DIOGO HERON MACOWSKI

apostila completa.doc

Embed Size (px)

Citation preview

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCÂMPUS DE CAMPO MOURÃO

APOSTILA DE ESTATÍSTICA APLICADA PARA O CURSO DE TECNOLOGIA EM ALIMENTOS

Professor: DIOGO HERON MACOWSKI

CAMPO MOURÃO, 2008

Tecnologia em Alimentos – 2º período.Estatística Aplicada - Prof. Diogo Heron Macowski

PRINCÍPIOS DE EXPERIMENTAÇÃO

ORIGEM

Muito do conhecimento que a humanidade acumulou ao longo dos séculos foi adquirido através da experimentação. Todos nós já aprendemos alguma coisa experimentando algo, porém, a idéia de experimentação como técnica sistemática de pesquisa, formalizada através da estatística é recente.

As técnicas de experimentação são universais e se aplicam a diferentes áreas – agronomia, medicina, engenharia, etc. – sendo os métodos de análise sempre os mesmos.

Boa parte da formalização que existe hoje em experimentação se deve a Sir Ronald Fisher, estatística que trabalhou na Estação Experimental Agrícola de Rothamstead, Inglaterra. Por este motivo, os termos técnicos utilizados em experimentação tem sua origem na agricultura.

O termo parcela foi criado para designar a unidade de área usada no experimento. Este termo tem, hoje, significado mais geral, podendo ser um animal, uma peça fabricada, uma pessoa, etc.. O termo parcela pode ser substituído por unidade experimental por ser mais abrangente.

O termo tratamento, que inicialmente era utilizado para os denominar os diferentes produtos para “tratamento” da agricultura tem atualmente sentido mais abrangente. Muitos experimentos são feitos para comparar coisas – máquinas, métodos, produtos, etc. – nestes casos, por exemplo, o conjunto formado pelos produtos tipo A constituem um tratamento enquanto que o conjunto formado pelos produtos tipo B constituem outro tratamento.

Em experimentação, nem sempre o interesse é em comparar diferentes tratamentos. Muitas vezes o interesse é simplesmente em avaliar se um determinado tratamento é eficiente. Para este tipo de análise, recorre-se ao chamado grupo controle, também conhecido como testemunha. O grupo controle seria aquele grupo formado por unidades experimentais que não receberam um tratamento e que servirão de base para verificar se o grupo tratado apresentou diferença.

Deve-se salientar que em diferentes áreas, mas principalmente na área médica, a ética deve predominar em relação à experimentação.

Finalmente, o que está sendo observado no experimento é a variável em análise.

REPETIÇÃO

A idéia, em experimentação, é comparar grupos, não apenas unidades. As unidades experimentais do mesmo grupo (ou mesmo tratamento) recebem, em estatística, o nome de repetições ou réplicas. È de fundamental importância a utilização de repetições.

Do ponto de vista da estatística, é sempre desejável que os experimentos tenham grande número de repetições. Na prática, o número de repetições é limitado pelos recursos disponíveis. O pesquisador deve levar em conta o que é usual na área.

De qualquer forma, convém deixar claro que é possível calcular o número de repetições que devem ser utilizadas em um experimento. A aplicação de fórmulas exige que o pesquisador conheça a variabilidade do produto experimentado. Quanto mais homogêneo for o produto, menor será o número de repetições necessário para mostrar, com clareza, o efeito de um tratamento.

CASUALIZAÇÃO

Formalmente proposta por Fisher na década de 20 é uma das maiores contribuições dos estatísticos à ciência experimental. Só a casualização garante que unidade com características diferentes tenham igual probabilidade de serem designadas para os grupos. Em síntese, a casualização não permite ao pesquisador “escolher” os elementos que pertencerão a cada grupo.

EXPERIMENTOS CEGOS E DUPLAMENTES CEGOS

Estes experimentos visam a total imparcialidade entre os pesquisadores quanto às unidades experimentais analisadas. Neste tipo de experimentos é necessária a presença de no mínimo dois pesquisadores.

O PLANEJAMENTO DO EXPERIMENTO

O Experimento está planejado quando estão definidos:

a) a unidade experimental;

b) a variável em análise;

c) os tratamentos em comparação;

d) a forma com que os tratamento serão designados às unidades experimentais.

Exemplo:

Imagine que se deseja comparar o efeito de duas rações na engorda de suínos. Planeje o experimento.

Tecnologia em Alimentos – 2º período.Estatística Aplicada - Prof. Diogo Heron Macowski

DELINEAMENTOS EXPERIMENTAIS

Para planejar um experimento, é preciso definir a unidade experimental e a variável em análise. Também é preciso definir os tratamentos em comparação e a maneira de designar os tratamentos às unidades. No capítulo anterior viu-se a absoluta necessidade de designar os tratamentos às unidades experimentais por processo aleatório. Mas, às vezes, é preciso impor algumas restrições à casualização. Neste capítulo, são dadas algumas formas alternativas de proceder ao sorteio dos tratamentos, respeitando as restrições que o pesquisador considera necessárias.

Experimentos inteiramente ao acaso.Os experimentos inteiramente ao acaso só podem ser conduzidos quando as unidades são similares. Mas a idéia de similaridade precisa ser bem entendida. Não existe um conjunto de “animais iguais”, nem uma faixa de terra de “fertilidade igual”. Em experimentação, porém, as unidades não precisam ser iguais. Basta que respondam ao tratamento da mesma forma. Por exemplo, nos testes de ganho de peso os animais não precisam ser iguais mas, para que sejam considerados similares, é preciso que sejam da mesma ração, mesmo sexo, mesma idade e que tenham, no inicio do experimentos, pesos bastantes próximos.

Experimentos inteiramente ao acaso com número diferente de repetições. O pesquisador nem sempre dispõe para seu experimento de um número de unidades que é múltiplo de tratamento que pretende estudar. O que deve fazer um professor que pretende comparar dois métodos de ensino e dispõe, para o experimento, de 41 crianças similares em relação à aptidão para aprender?Os delineamentos com número diferente de repetições são indicados para comparar diversas drogas terapêuticas com um controle. Nesses casos, recomenda-se fazer mais repetições no grupo controle do que nos grupos tratados. Afinal de contas, todos os grupos tratados serão comparados com o mesmo grupo controle.

Experimentos em blocos ao acaso.Os experimentos em blocos ao acaso surgiram na área agrícola. O campo era dividido em blocos e os blocos eram divididos em parcelas. Então o termo bloco designava, originalmente, uma faixa de terra de mesma fertilidade. O termo bloco tem, hoje, significado bm mais geral. Ainda pode ser uma faixa de terra, mas também pode ser uma ala da estufa, um período de tempo, uma ninhada, uma partida de produtos industriais, uma faixa de idade – tudo depende do que está em experimentação. O essencial é que os blocos reúnam unidades similares – que se distingam apenas pelo tratamento que recebem – e que haja variabilidade entre blocos. Não existe sentido em organizar blocos se não houver variabilidade entre os blocos. Mas quem decide se a variabilidade entre as unidades justifica ou não a formação de blocos é o pesquisador.

Experimentos em blocos ao acaso com repetições.A idéia de construir blocos para comparar unidades similares é, basicamente, simples, mas pode gerar algumas dificuldades. Por exemplo, o número de unidades que caem dentro de

cada bloco pode ser maior do que o número de tratamentos que o pesquisador pretende comparar. A análise estatística dos experimentos em blocos ao acaso com repetições é relativamente fácil, desde que o número de unidades dentro de cada bloco seja um múltiplo do número de tratamentos que se pretende comparar.

Exercícios:Ex.1 – Planeje um experimento para comparar quatro drogas no alívio da cefaléia, supondo que você dispõe de um conjunto de pacientes similares.Ex.2 – Planeje um experimento para comparar quatro drogas no alívio da cefaléia, tomando cada paciente como um bloco.Ex.3 – Planeje um experimento para comparar três fórmulas de adubação no crescimento de Pinus, supondo que você dispõe de um terreno heterogêneo que deve ser dividido em cinco blocos e que em cada bloco podem ser alocadas nove parcelas.Ex.4 – Planeje um experimento para comparar dois testes de inteligência tomando cada criança como um bloco.

Tecnologia em Alimentos – 2º período.Estatística Aplicada - Prof. Diogo Heron Macowski

ESTIMAÇÃO

INTRODUÇÃO

A dedução de informações relativas a uma população, mediante a utilização de amostras aleatórias dela extraídas, diz respeito à Inferência Estatística.

Um problema importante da inferência é a estimação de parâmetros (tais como média, variância e proporção da população) deduzidos da estatística, ou seja, da média, variância e proporção da amostra proveniente desta população.

Pode-se distinguir dois casos de estimação de parâmetros: a estimação por ponto e a estimação por intervalo. No primeiro caso obtém-se um valor único para o parâmetro, ao passo que, no segundo, constrói-se um intervalo em torno da estimativa por ponto, o qual deverá, com probabilidade conhecida, conter o parâmetro.

ESTIMADOR E ESTIMATIVA

Estimador t de um parâmetro é a variável aleatória, função dos elementos da amostra, que será utilizada na estimação. O valor numérico obtido para o estimador considerado, numa certa amostra, é denominado de estimativa.

A notação utilizada para estimador geralmente é feita através do uso de letras maiúsculas, enquanto que, para estimativa o uso recai sobre as letras minúsculas.

QUALIDADES DE UM BOM ESTIMADOR

Um bom estimador deve possuir determinadas qualidades que o caracterizam como tal. As qualidades são:

1 – Estimador não tendencioso (justo ou não-viciado)

Um estimador tn de um parâmetro é dito não tendencioso se .

A tendenciosidade (B) é definida como sendo a diferença .

2 – Estimador consistente (ou coerente)

Um estimador tn de um parâmetro é dito consistente se para todo

A definição acima pode ser substituída pelas condições: e

De uma maneira menos formal, pode-se dizer que um estimador é consistente quando para amostras suficientemente grandes tornam o erro de estimação tão pequeno quanto se queira.

3 – Estimador de variância mínima

Uma qualidade desejável para os estimadores é que sejam eficientes, isto é, que tenham variância mínima.

Dados dois estimadores t1 e t2, a serem usados na estimação de um mesmo parâmetro , diz-se que t1 é mais eficiente que t2 como estimador de se, para o mesmo tamanho da amostra,

V(t1) < V(t2)

Pode-se demonstrar que, dada uma variável aleatória X de média e variância , a média aritmética de uma amostra de n observações é, dentre os estimadores lineares não tendenciosos, o estimador de variância mínima.

4 – Estimador suficiente

De uma forma bastante simples, pode-se dizer que os estimadores suficientes são aqueles que tem a capacidade de retirar das amostras toda a informação que elas pode fornecer.

ESTIMAÇÃO POR PONTO

Na estimação por ponto o parâmetro é estimado através de um único valor, o qual corresponde a um ponto sobre o eixo de variação da variável. Os principais estimadores por ponto são:

Estimador da média populacional

A expressão é dada por:

Estimador da variância populacional

quando a média populacional for conhecida e,

quando for desconhecida.

Para grandes amostras, será indiferente usar n ou n – 1 no denominador da expressão acima.

Estimador da proporção populacional p

A expressão é dada por :

ESTIMAÇÃO POR INTERVALOS

Na estimação por intervalo constrói-se um intervalo em torno da estimativa por ponto, de modo que este intervalo tenha uma probabilidade conhecida de conter o verdadeiro valor do parâmetro.

Seja o parâmetro , tal que ,

- o intervalo é denominado intervalo de confiança (IC);

- os extremos desse intervalo e são chamados limites de confiança;

- a probabilidade conhecida é denominada nível de confiança;

- é chamado de nível de significância.

A escolha de nível de confiança depende da precisão com que se deseja estimar o parâmetro.

Intervalo de confiança para a média populacional

1 – quando desvio padrão populacional for conhecido.

Utiliza-se a distribuição normal padronizada em que: ,

onde

Desta forma, o IC para será

Exemplo:

O desvio padrão dos comprimentos das peças produzidas por certa máquina é de 2mm. Uma amostra de 50 peças produzidas por esta máquina apresentou média . Construir o IC de 95% de confiança para o verdadeiro comprimento das peças produzidas pela máquina.

2 – quando desvio padrão populacional for desconhecido.

Utiliza-se a distribuição t de student em que: ,

onde com graus de liberdade.

Desta forma, o IC para será

Exemplo:

Uma amostra de cabos produzidos por uma indústria foi ensaiada e as tensões de ruptura obtidas foram: 750, 780, 745, 770 e 765 kgf. Construir o IC de 99% para a verdadeira tensão de ruptura desses cabos.

Obs.: Quando o tamanho da população for finito e conhecido, aplica-se um fator de correção e a expressão torna-se:

Intervalo de confiança para a variância populacional

Utiliza-se a distribuição Qui-quadrado em que

Onde com graus de liberdade.

Desta forma, o IC para será

Exemplo: Um mesmo ângulo foi medido 5 vezes obtendo-se os resultados 30º15’ 30º13’

30º17’ 30º15’ e 30º14’. Estimar a variância através de um IC de 95%.

Intervalo de confiança para a proporção populacional p

Para amostras suficientemente grandes, a distribuição amostral das proporções é aproximadamente normal com:

,

Para o cálculo deve-se estimar a proporção populacional p utilizando a estimativa por ponto P,desta forma:

e , obtém-se o IC:

Exemplo:

Em uma amostra de 200 peças produzidas por certa máquina, verificou-se que 10 eram defeituosas. Estimar a verdadeira proporção de peças defeituosas por essa máquina, utilizando um IC de 90%

DIMENSIONAMENTO DE AMOSTRAS

O objetivo do dimensionamento de amostras é a determinação do tamanho mínimo que se deve tomar para amostra, de modo que, o erro ao estimarmos o parâmetro seja menor que um valor especificado.

Como exemplo, considere o dimensionamento de uma amostra para a estimação da média populacional , através de um IC. A precisão (semi-amplitude de IC) é dada por

, quando o desvio padrão populacional for conhecido, onde:

Exemplo: Qual o tamanho de uma amostra suficiente para estimarmos a média de uma população infinita cujo desvio padrão é 3,2 com 95% de confiança e precisão de 80%?

Tecnologia em Alimentos – 2º período.Estatística Aplicada - Prof. Diogo Heron Macowski

LISTA DE EXERCÍCIOS DE DELINEAMENTOS E ESTIMAÇÃO.DelineamentosEx.1 – Suponha que você disponha de 7 maçãs, 6 goiabas e 9 pêras para a realização de um experimento que consiste em comparar e verificar a eficiência de 2 filmes plásticos para embalar frutas. Planeje o experimento e ilustre através de um diagrama.

Ex.2 – Uma padaria produz um tipo de bolo e um tipo de pão que serão utilizados em um experimento que consiste em comparar três tipos de fermento. A variável em análise será a consistência do produto acabado. Planeje um experimento que contenha 4 repetições. Ilustre os descreva detalhadamente (informe a quantidade de produtos analisados, etc.).

Estimação por pontoEx.3 – Uma amostra de 10 doces de leite foi ensaiada e o teor de açúcar (ºBRIX) foi: 45 47 42 46 47 43 45 45 48 46. a) Estime o teor médio de açúcar dos doces deste tipo.b) Estime a variância dos doces produzidos.c) Estime o desvio padrão dos doces produzidos.

Ex.4 – Uma análise sensorial foi realizada com o intuito de verificar a aprovação de um novo produto. Neste teste são dadas notas de 1 a 9, onde 1 representa desgostei muitíssimo e 9 representa gostei muitíssimo. O teste utilizou 16 provadores não treinados e os resultados foram: 5 6 6 7 9 5 6 8 9 8 5 7 6 7 8 9. Com base nesta experiência amostral quer se estimar parâmetros para a população que poderia ser consumidora de tal produto. Para isto, estime:a) A nota média do produto.b) O desvio padrão.c) A proporção de pessoas que consideraria o produto muito bom (nota > 8).

Estimação por intervalosEx.5 – Uma amostra de 9 pães de uma mesma panificadora foi ensaiada para estimar a massa dos pães do tipo francês produzidos. Sabe-se que a variância das massas é igual a 16 g2. Construa um intervalo de confiança, ao nível de 1%, para a média das massas do pão desta padaria.

Ex.6 – Utilizando os dados do exercício 3, realize as mesmas estimações através de um intervalo de confiança (IC), com 5% de significância.

Ex.7 – Com base nos dados do exercício 4, realize as mesmas estimações através de um intervalo de confiança (IC), com 10% de significância.

Ex.8 – Foram realizadas 12 determinações de densidade (g/cm3) de um certo composto, obtendo-se os resultados: 19,0 19,3 19,1 19,3 19,2 19,4 19,2 19,3 19,2 19,0 19,5 19,3. estimar a média e a variância através de um IC de 95% de confiança.

Ex.9 – Foram realizadas 30 determinações da vazão de um rio em determinada secção, obtendo-se a tabela de freqüências abaixo:

Vazão (m3/s) Freqüência10|---12 312|---14 314|---16 1016|---18 818|---20 420|---22 2

Estimar a média e o desvio padrão populacional através de IC de 90%.

Ex.10 – Qual o tamanho mínimo da amostra para se estimar a média de uma população cujo desvio padrão é 10, com confiança de 99% e precisão igual a 4. Supor que a amostra é obtida de:a) Uma população infinita.b) Uma população de 1000 elementos.

Ex.11 – Obtenha a fórmula que permite determinar o tamanho da amostra necessária para estimar uma proporção.

Tecnologia em Alimentos – 2º período.Estatística aplicada – Prof. Diogo Heron Macowski.

TESTE DE HIPÓTESES

1. DEFINIÇÕES

Hipóteses Estatísticas:

São suposições que se faz, acerca dos parâmetros de uma população, ao se tentar a tomada de decisões. Essas suposições poderão ser verdadeiras ou falsas.

Hipóteses nula e alternativa:

Hipótese nula (H0): é qualquer hipótese que será testada (sempre terá o sinal da igualdade).

Hipótese alternativa (H1): é qualquer hipótese que contradiga a hipótese nula.

O teste de hipóteses coloca a hipótese nula H0 em contraposição à hipótese alternativa H1. Suponhamos que seja o parâmetro a ser testado. As hipóteses nula e alternativa geralmente são enunciadas como:

(1) (2) (3)

Regiões de aceitação e rejeição:

Região de aceitação (RA): é a região em que se aceita a hipótese nula. Pode ser um trecho do eixo das abscissas onde serão representados os valores da variável de interesse.

Região de rejeição (RR) ou região crítica (RC): é a região em que se rejeita a hipótese nula, sendo complementar a região de aceitação.

Erros do tipo I e II:

Na aplicação de um teste de hipóteses, pode-se cometer dois tipos de erros:

Erro do tipo I: é o erro cometido ao rejeitarmos a hipótese nula quando ela é verdadeira;

Erro do tipo II: é o erro cometido ao aceitarmos a hipótese nula quando ela é falsa.

Nível de significância:

É a probabilidade máxima com a qual se sujeitaria a cometer erro do tipo I. Essa probabilidade é pode ser representada da seguinte maneira:

Na pratica é muito comum o uso dos valores 0,05 (5%) ou 0,01 (1%).

A probabilidade de se cometer erro do tipo II é dada por:

Testes unilateral e bilateral:

Teste unilateral: quando a RR estiver em apenas um dos extremos do eixo da variável de interesse.

Teste bilateral: quando a RR estiver nos dois extremos do eixo da variável de interesse.

Esquema geral de um teste de hipóteses:1º) Enunciar a hipótese nula;2º) Enunciar a hipótese alternativa;3º) Fixar o nível de significância;4º) Escolher a distribuição de probabilidade adequada ao teste e delimitar as regiões RA e RR;5º) Calcular a estatística do teste com base de uma amostra aleatória;6º) Conclusão: com base no valor amostral obtido, tomar a decisão de rejeitar ou aceitar H0.

Teste de hipóteses para a média populacional 1º caso: Se a variância populacional for conhecida:Distribuição de probabilidade utilizada: Gaussiana (Normal)

Estatística do teste: conclusão:

2º caso: Se a variância populacional for desconhecida:Distribuição de probabilidade utilizada: t student, com grau de liberdade

Estatística do teste: conclusão:

Exemplos: 1) Uma população tem desvio padrão igual a 5 mm. Se uma amostra de 50 elementos, obtida dessa população tem média igual a 46mm, podemos afirmar que a média dessa população seja superior a 43 mm, ao nível de 1% de significância?

2) Um fabricante afirma que a tensão média de ruptura dos cabos produzidos por sua companhia não é inferior a 500 kgf. Uma amostra de 7 cabos foi ensaiada, obtendo-se os

resultados (em kgf): 490 480 495 493 475 478 485. Testar a afirmação do fabricante, ao nível de 5% de significância.

Tecnologia em Alimentos – 2º período.Estatística aplicada – Prof. Diogo Heron Macowski.

TESTE DE HIPÓTESES

TESTE PARA A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS

PASSOS COMUNS AOS TESTES: (1)

(2)

(3) Fixar o nível de significância

1º CASO: Desvios padrões e conhecidos.

(4) Determinar a R.C.

(5) Calcular a estatística do teste:

(6) Conclusões: a) se , rejeita-se H0

b) se , rejeita-se H0

b) se , rejeita-se H0

Exemplo: Uma amostra de 100 válvulas da Companhia A tem média 1530 h, sendo o desvio padrão populacional igual a 100 h. Uma outra amostra de 70 válvulas da companhia B tem média 1420 h e desvio padrão populacional de 80 h. Testar a hipótese de que as válvulas da companhia A em relação a companhia B tem duração média superior a 100 h. Utilizar .

2º CASO: Desvios padrões populacionais desconhecidos mas supostamente iguais.

(4) Determinar R.C. conforme graus de liberdade:

(5) Calcular a estatística do teste:

Onde:

(6) Conclusões: a) se , rejeita-se H0

b) se , rejeita-se H0

b) se , rejeita-se H0

Exemplo: Dois tipos de soluções químicas foram ensaiados para se determinar os pH. Os resultados obtidos foram:Solução A: 7,50 7,54 7,51 7,53 7,50Solução B: 7,49 7,50 7,51 7,52 7,50 7,51Testar a hipótese de que não existe diferença entre os pH médios das duas soluções, supondo que os desvios padrões populacionais são iguais. Usar .

3º CASO: Desvios padrões populacionais desconhecidos mas supostamente diferentes.

(4) Determinar R.C. conforme graus de liberdade: ,

Onde e

(5) Calcular a estatística do teste:

(6) Conclusões: a) se , rejeita-se H0

b) se , rejeita-se H0

b) se , rejeita-se H0

Exemplo: Uma mesma distância foi medida 5 vezes por certo instrumento, antes e após sofrer uma calibração. Antes da calibração os resultados foram: 100,8 101,3 100,6 99,5 100,1 e após a calibração: 100,5 100,4 100,5 100,3 100,3. Testas a hipótese de que não existe diferença entre os resultados obtidos antes e após a calibração do instrumento. Utilizar o nível de significância de 5%.

4º CASO: Dados emparelhados.

(4) Determinar a R.C. com graus de liberdade:

(5) Calcular a estatística do teste:

Onde ; ;

(6) Conclusões: a) se , rejeita-se H0

b) se , rejeita-se H0

b) se , rejeita-se H0

Exemplo: Dois operários determinam os pesos (em g) das impurezas contidas em 6 amostras de certo produto químico, obtendo os resultados:amostras 1 2 3 4 5 6Operário A 10,1 10,4 10,2 10,5 9,9 10,0Operário B 9,8 10,0 10,1 10,0 10,1 9,5Pode-se concordar com a hipótese de que não existe diferença entre as determinações dos dois operários, no nível de 1%?

Testes de hipóteses no Microsoft Excel:Suponha que você tenha os dados a serem comparados dispostos da forma abaixo, onde o grupo A esta na linha 2 e o grupo B na linha 3 (também poderiam estar dispostos em colunas).

Utilize o caminho: FERRAMENTAS >> ANÁLISE DE DADOS

Você deverá escolher uma dos casos, de acordo com o problema, e selecionar na caixa que se abrirá automaticamente (desça a barra de rolagem até o final):

Os quatro itens finais correspondem aos quatro casos de teste de hipóteses para diferença entre duas médias. Se o problema for para dados emparelhados, selecionar “teste-T: duas amostras em par para média” e preencha o quadro que se abrirá:

Para selecionar o campo 1, basta clicar na célula A2 (Marca A)e mantendo o botão esquerdo do mouse apertado arrasta-lo até a célula F2 (120), O mesmo procedimento para o campo 2, ou seja, selecionar da célula A3 até F3.O campo destinado a hipótese de diferença de média deve ser preenchido com o valor numérico correspondente ao lado direito da igualdade na hipótese nula do exercício. Supondo que as hipóteses sejam: , logo, o campo deve ser preenchido com o zero.O campo rótulo deve ser acionado caso você tenha selecionado o titulo de cada linha no campo 1 e 2. Neste exemplo, devemos acionar o rótulo em virtude de termos iniciado nossa seleção em A2, que contem um texto (Marca A).Para fazer o resultado aparecer na mesma planilha em que você está trabalhando, clique no círculo ao lado de intervalo de saída, depois (obrigatoriamente) clique no retângulo a esquerda de intervalo de saída e somente então clique em alguma célula vazia da planilha

que você está trabalhando. Ao fim desta operação o quadro estará preenchido da seguinte forma:

Em seguida clique em OK e interprete o resultado:

Tecnologia em Alimentos – 2º período.Estatística aplicada – Prof. Diogo Heron Macowski.

TESTE PARA A PROPORÇÃO POPULACIONAL p

(1) H0: p = p0

(2) H1:

(3) Fixar o nível de significância (4) Determinar a R.C. segundo a distribuição normal.

(5) Estatística do teste:

(6) Conclusões: a) , rejeita-se H0

b) , rejeita-se H0

c) , rejeita-se H0

Exemplo: Para determinarmos se um certo tipo de tratamento para evitar a corrosão é eficiente, 45 tubos de um total de 50 apresentaram resultados satisfatórios. Sabe-se que o tratamento é considerado eficiente se pelo menos 95% dos tubos apresentarem resultado satisfatório. Qual a conclusão, ao nível de 5%?

TESTE PARA DIFERENÇA ENTRE DUAS PROPORÇÕES POPULACIONAIS p1 e p2

(1) H0:

(2) H1:

(3) Fixar a significância (4) Determinar a R.C. segundo a distribuição Normal

(5) Estatística do teste:

(6) Conclusões: a) , rejeita-se H0

b) , rejeita-se H0

c) , rejeita-se H0

Exemplo:Uma indústria automobilística anuncia que os automóveis do modelo A supera em vendas os do modelo B de 10%. Tomadas duas amostras aleatórias independentes encontrou-se que 56 de 200 consumidores preferem o modelo A e 29 de 150 preferem o modelo B. Testar a hipótese ao nível de 6% de que o modelo A supera o modelo B em 10%, contra a hipótese de que esta diferença é menor que 10%.

Tecnologia em Alimentos – 2º período.Estatística aplicada – Prof. Diogo Heron Macowski.

TESTE PARA A VARIÂNCIA POPULACIONAL

(7) H0:

(8) H1:

(9) Fixar o nível de significância (10) Determinar a R.C. segundo a distribuição qui-quadrado.

(11) Estatística do teste:

(12) Conclusões: a) , rejeita-se H0

b) , rejeita-se H0

c) ou , rejeita-se H0

Exemplo: As chapas de aço produzidas por certa indústria te uma especificação tal que a variância de suas espessuras (em mm) não deve ser superior a 0,0009 mm2. Uma amostra de 10 chapas tem espessura: 3,15 3,18 3,15 3,12 3,14 3,13 3,17 3,16 3,15 3,16. Testar a hipótese de que a variância está dentro da especificação, usando o nível de 5%.

TESTE PARA IGUALDADE DE DUAS VARIÂNCIAS POPULACIONAIS e

(7) H0:

(8) H1:

(9) Fixar a significância (10) Determinar a R.C. segundo a distribuição F

(11) Estatística do teste:

(13) Conclusões: a) , rejeita-se H0

b) , rejeita-se H0

c) ou , rejeita-se H0

Foram testadas as durabilidades (em km) dos pneus das marcas A e B, obtendo-se para 5 pneus de cada marca os resultados:Marca A: 30000 32000 28000 26000 31000Marca B: 25000 30000 20000 21000 23000Existe diferença significativa entre as variâncias das durabilidades dos dois pneus, no nível de significância de 10%?

TESTE PARA IGUALDADE DE k (k > 2) VARIÂNCIAS POPULACIONAIS , ,

(TESTE DE BARTLETT)

(1) H0: (2) H1: pelo menos uma das variâncias é diferente das demais.(3) Fixar o nível de significância (4) Determinar a R.C. através da distribuição qui-quadrado com graus de liberdade.(5) Calcular a estatística do teste:

onde:

, , e

(6) Conclusão: se , rejeita-se H0.

Exemplo:Três topógrafos mediram um mesmo ângulo, obtendo os resultados:Top. A: 15º1’ 15º2’ 15º4’ 15º2’Top. B: 15º3’ 15º4’ 15º5’Top. C: 15º1’ 15º6’ 15º2’ 15º7’ 15º7’Ao nível de significância de 1%, há evidencia de que as variâncias populacionais sejam iguais?

Tecnologia em Alimentos – 2º período.Estatística aplicada – Prof. Diogo Heron Macowski.

LISTA DE EXERCÍCIOS DE TESTE DE HIPÓTESES.

Ex.1 – Uma fabrica anuncia que o índice de nicotina dos cigarros da marca X apresenta-se abaixo de 26 mg por cigarro. Um laboratório realiza 10m análises do índice obtendo: 26 24 23 22 28 25 27 26 28 e 24. Sabe-se que o índice de nicotina nos cigarros da marca X distribui-se normalmente com variância 5,36 mg2. Pode-se aceitar a afirmação do fabricante ao nível de 5%?

Ex.2 – Uma fabrica de automóveis anuncia que seus carros consomem, em média 11 litros por 100 km, com desvio padrão de 0,8 litros. Uma revista especializada decide testar essa afirmação e analisa 35 carros dessa marca, obtendo 11,4 litros por 100 km, como consumo médio. Admitindo que o consumo tenha distribuição normal, ao nível de 10% o que a revista concluirá sobre o anúncio da fabrica?

Ex.3 – Os indivíduos de um país apresentam altura média de 170 cm e desvio padrão de 5 cm. A altura tem distribuição normal. Uma amostra de 40 indivíduos apresentou média de 167 cm. Podemos afirmar, ao nível de 5%, que essa amostra é formada por indivíduos com a altura média menor que 170 cm?

Ex. 4 – Uma fabrica produz certo tipo de reguladores de pressão. Esses reguladores são produzidos para suportar uma pressão de 20 atm. Um ensaio é realizado com uma amostra de 7 desses reguladores de pressão e os resultados foram: 19,5 18,9 19,0 19,1 18,9 19,3 19,0. Com base neste ensaio, podemos concluir que a pressão suportada é realmente inferior a 20 atm, ao nível de 1%?

Ex. 5 – Uma padaria informa que seu pão francês tem massa igual a 50 g. Uma amostra com 10 pães foi pesada e os resultados são apresentados a seguir: 48 51 46 60 49 51 47 52 46 47. Determine se a informação dada pela padaria é correta ao nível de 5%.

Ex. 6 – Uma empresa informa que o tempo gasto por uma máquina para realizar uma operação industrial é de 120 segundos, com desvio-padrão de 8s. Uma experiência realizada sobre este tempo de operação acusou média de 123s, após 17 realizações. Realize o teste de hipóteses, com significância de 10%, nos seguintes casos:

a) teste bilateral;b) teste unilateral;c) existe diferença na tomada de decisão entre (a) e (b). Conclua.

Ex. 7 – Duas amostras de tubos das marcas A e B foram ensaiadas e as resistência médias obtidas foram 40 kgf/mm2 e 35 kgf/mm2, com variâncias 5 e 4,5 respectivamente. Sabendo-se que foram ensaiados 15 tubos de cada marca, há evidência, ao nível de 1%, de que a resistência média dos tubos da marca A seja maior que a da marca B?

Ex. 8 – Duas máquinas A e B produzem parafusos e sabe-se que as variâncias dos comprimentos dos parafusos produzidos são 25 mm2 e 20 mm2, respectivamente. Uma amostra de 40 parafusos da máquina A apresentou comprimento médio de 30 mm,

enquanto que uma amostra de 50 parafusos da máquina B apresentou média de 25 mm. Existe diferença significativa entre os comprimentos dos parafusos produzidos pelas duas máquinas, ao nível de 5%?

Ex. 9 – Foram ensaiadas válvulas das marcas A e B. Verificou-se que os tempo de vida (em h) foram:Marca A: 1500 1450 1480 1520 1510 Marca B: 1000 1300 1250Pode-se concluir, ao nível de 1%, que o tempo médio de vida das válvulas da marca A supera o de B em mais de 300h? Supor que os desvios padrões populacionais sejam diferentes.

Ex.10 – Um metalúrgico decide testar a pureza de um certo metal, que supões ser constituído exclusivamente de manganês. Adota para isso o critério da verificação do ponto de fusão. O ponto de fusão do manganês puro é igual a 1260º, com desvio padrão de 2º. O metalúrgico realizou 4 experiências, obtendo 1267º, 1269º, 1261º, 1263º. Poderá ele aceitar que o metal é puro ao nível de 10%.

Ex.11 – Uma máquina de misturar fertilizantes é adaptada para fornecer 10g de nitrato para cada 100g de fertilizante. Dez porções de 100g foram analisadas, com as seguintes porções de nitrato: 9, 12, 11, 10, 11, 9, 11, 12, 9, 10. Há razões para crer que a porção de nitrato é diferente da informada, ao nível de 10%?

Ex.12– Um grupo de 10 pessoas é submetido a um tipo de dieta por 10 dias, estando o peso do inicio e no final da dieta marcados na tabela abaixo. Ao nível de 5%, podemos concluir que houve diminuição do peso pela aplicação da dieta?Pessoa A B C D E F G H I JInicio 120 104 93 87 85 98 102 106 88 90Fim 116 102 90 83 86 97 98 108 82 85

Ex.13– De duas populações normais A e B, com variâncias 25, levantaram-se duas amostras de tamanhos 9 e 16, respectivamente, obtendo média 3 para a amostra A e média 2 para a amostra B. Teste, ao nível de 5%, se a média da população A é maior que a média da população B.

Ex.14 – Em uma prova de estatística, uma amostra de 12 alunos de uma classe conseguiram média 7,8 e desvio padrão 0,6, ao passo que uma outra amostra de 15 alunos de outra classe, do mesmo curso, conseguiram média 7,4 com desvio padrão 0,8. Considerando distribuições normais para as notas e supondo que as variâncias sejam iguais entre as classes, verificar se o primeiro grupo é superior ao segundo, ao nível de 5%.

Ex.15– O QI de 16 estudantes de uma zona pobre de certa cidade apresenta a média de 107 pontos com desvio padrão de 10 pontos, enquanto os 14 estudantes de outra região rica da cidade apresentam média 112 pontos com desvio padrão de 8 pontos. Teste se existe diferença, ao nível de 10 %, entre os dois grupos.

Ex.16 – Para o seguinte conjunto de dados: 19,5 18,9 19,0 19,1 18,9 19,3 19,0. Testar ao nível de 1%, se a variância populacional é superior a 1.

Ex.17 – Um operário realizou uma mesma operação com 2 equipamentos diferentes e os tempos gastos (em segundos) foram:Equipamento A: 10 11 10 12 15Equipamento B: 08 10 15 12Existe diferença significativa entre as variâncias ao nível de 5%.

Ex.18 – Um fabricante afirma que no máximo 3% das peças fabricadas são defeituosas. Uma amostra com 50 peças apresentou 4 com defeito. Com base neste resultado, qual a conclusão ao nível de 10%.

Tecnologia em Alimentos – 2º período.Estatística aplicada – Prof. Diogo Heron Macowski.

A análise de variância, conhecida por ANOVA, consiste de uma generalização do teste para igualdade de duas médias populacionais. Nesta análise testamos k (k > 2) médias populacionais com base na estatística F.

Suponha que se deseja testar a hipótese de k (k > 2) médias populacionais sejam iguais, ou seja:

contra a hipótese alternativa de que pelo menos uma dessas médias seja diferente das demais.

No modelo de analise de variância a um critério de classificação, existe apenas uma característica de interesse a ser testada.

Sejam k populações P1 , P2 , ... ,Pk e as amostras correspondentes de tamanhos n1 , n2 , ... , nk.

Considere que: é o i-ésimo elemento da j-ésima amostra. é a média da j-ésima amostra. é a média do conjunto das k amostras.

N é o número total de observações das k amostras. é o tamanho da j-ésima amostra.

Tem-se então os seguintes passos para a determinação da ANOVA.(1)

(2) H1: pelo menos uma das médias é diferente das demais.

(3) Fixar o nível de significância , com base na confiança desejada.

(4) Determinar a Região de Rejeição (RR)

(5) Calcular a estatística do teste segundo as fórmulas abaixo:

Onde, demonstra-se que

SQT = SQE + SQR

- elabora-se então o quadro da ANOVA:

k

j

k

j

n

iij

j

n

iijk

j

n

i N

x

n

x

XxSQE

ji

j

j

1

2

1 1

2

1

1 1

2

QUADRO 2.2 – ANOVA

Fonte devariação

Soma dos quadrados Graus deLiberdade

Quadrado médio (s2) Estatística F

Entreamostras

SQE K – 1 QME F

Residual SQR N - K QMRTotal SQT N – 1

FONTE: MARQUES & MARQUES 92005, p.190)

(6) Conclusão: se F > , rejeita-se H0, caso contrário, aceita-se H0.Obs.: EXCEL: Ferramentas > Análise de dados > Anova: fator único.Exemplo:Em uma indústria, quatro operários executam a mesma operação. Com o objetivo de identificar se existe diferença significativa entre os tempos gastos para executar a operação mencionada, foram realizadas as seguintes observações destes tempos (em segundos):Operário 1: 8,1 8,3 8,0 8,1 8,5Operário 2: 8,4 8,4 8,5 8,3Operário 3: 8,8 8,7 8,9 Operário 4: 8,3 8,4 8,2 8,2 8,3 8,4Verificar se a diferença é significativa ao nível de 5%.

A tabela da ANOVA permite constatar se existe diferença significativa entre as médias populacionais, contudo, não informa entre quais grupos a diferença significativa se encontra.Vários testes podem ser utilizados, como Scheffé, Tukey, Duncan e Dunnett.

MÉTODO DE SCHEFFÉ

onde:

MÉTODO DE TUKEY

Onde:

, onde q é um valor obtido em tabela própria para o teste e r é o número

de repetições.

Exemplo:

Construa a tabela de conclusão, através do método de Scheffé.

Quadro da ANOVA para 2 fatores.Fonte deVariação

Soma dequadrados

Graus deliberdade

Quadrado médio

EstatísticaF

EntreLinhas

SQL n – 1 QML

EntreColunas

SQC k – 1 QMC

Residual SQR (n – 1)(k – 1) QMR

Total SQT

SQR = SQT – SQC – SQL

Análise de variância no Excel:Iniciar em “Ferramentas” e depois em “Análise de dados” (caso não apareça, tente o caminho: ferramentas > suplementos > ferramentas de análise).

Na seqüência, Anova: fator único

No campo “intervalo de entrada” selecione na tela a matriz contento todos os dados (não importando se o número de elementos de cada grupo for diferente).Informe se os dados (cada grupo) estão dispostos em linhas ou colunas.Informe a significância do teste.

Apresentação dos resultados:

Se F > Fcrítico, rejeita-se H0, ou se valor-P < , rejeita-se H0.

Exercício de análise de variância

A produtividade da soja depende de diversos fatores (solo, clima, tipo da semente, insumos, etc.). O preço final da saca de 50 kg varia de acordo com o mercado internacional, no momento, U$ 25,00. Uma área agrícola de 16 alqueires foi dividida, seguindo os passos de delineamentos experimentais apropriados, de forma que 4 insumos possam ser testados (supomos que este é o único fator diferenciado entre os grupos). Os preços destes insumos são diferentes e sabemos que:

insumo A < insumo B < insumo C < insumo DApós a colheita, verificou-se a quantidade colhida em cada alqueire, com os resultados apresentados na tabela abaixo:

insumo A insumo B insumo C insumo D

103 110 114 115

105 108 114 117

108 107 113 113

106 107 116 115Supondo que você fosse consultado para determinar qual insumo deveria ser escolhido, utilize a estatística para elaborar um parecer, baseado somente nesta amostragem.

Tecnologia em Alimentos – 2º período.Estatística aplicada – Prof. Diogo Heron Macowski.

LISTA DE EXERCÍCIOS DE ANOVA

Ex.1 – Uma empresa deseja adquirir certa máquina e verificou que existem na praça quatro marcas diferentes: A, B, C e D que satisfazem. Decidiu-se que será comprada a máquina que apresentar melhor rendimento. Foi realizado um ensaio com as quatro máquinas em períodos iguais durante 5 dias e as produções resultantes foram:

A 120 123 121 125 122B 119 121 118 120 123C 125 127 128 127 128D 123 121 121 120 120

Em relação ao rendimento, existe diferença significativa entre as marcas, ao nível de 1%. Utilize teste de Tukey para localizar as diferenças e elabore um quadro resumo.

Ex.2 – Três pesquisadores utilizando quatro métodos diferentes determinaram a velocidade do som (em m/s) em certo meio. Obtendo os resultados:

métodos pesquisadores

   P1 P2 P3A 341 342 340B 345 344 346C 338 339 340D 343 341 342

Podemos identificar se existe diferença significativa, ao nível de 5%, entre os pesquisadores? E entre os métodos? Use Tukey ou Scheffe para localizar as possíveis diferenças.

Ex.3 – Foram testadas três tipos de lâmpadas elétricas e os tempos de vida (em horas) obtidos foram:

Lâmpada A 1245 1354 1367 1289  Lâmpada B 1235 1300 1230 1189 1250Lâmpada C 1345 1450 1320    

Existe diferença significativa entre os tempos médios de vida dessas três marcas de lâmpadas, ao nível de significância de 1%? Se necessário, aplicar o teste de Scheffé.

Ex.4 – Seis máquinas produzem parafusos. Em seguida estão relacionados os diâmetros correspondentes a uma amostra de 4 parafusos produzidos em cada máquina.

A B C D E F

8 9 7 8 9 107 7 9 8 7 119 7 7 7 8 97 8 7 9 8 10

Testar se os diâmetros médios são iguais considerando um nível de significância de 5%. Se necessário aplique o teste de Tukey ou Scheffe.

Ex.5 – Os dados abaixo apresentam a produção, por hectare, de três safras diferentes de soja plantados com 4 tipos de fertilizantes. Utilizando a ANOVA, teste se (a) existe diferença significativa na produção por hectare, devida aos fertilizantes, (b) existe diferença de produção entre as safras. Se necessário utilize um teste de comparação de médias.

  Safra 1 Safra 2 Safra 3Fertilizante 1 5,4 6,3 6Fertilizante 2 7,9 8 8,3Fertilizante 3 6,1 5,8 6Fertilizante 4 5,9 6 6,3

Tecnologia em Alimentos – 2º período.Estatística aplicada – Prof. Diogo Heron Macowski.

CORRELAÇÃO

O problema da correlação está ligado ao grau de relação entre duas ou mais variáveis. Quando os valores dessas variáveis satisfazem exatamente uma equação, diz-se que elas são perfeitamente correlacionadas.Quando o problema envolve apenas duas variáveis tem-se correlação simples e, no caso de 3 ou mais variáveis, tem-se correlação múltipla.

CORRELAÇÃO LINEAR SIMPLES

Quando os valores das duas variáveis em estudo, por exemplo X e Y, tendem a cair nas proximidades de uma reta, fala-se em correlação linear.

O coeficiente de correlação linear é dado pela formula:

Este coeficiente varia entre –1< r < 1, sendo que os valores positivos indicam correlação direta e os valores negativos indicam correlação inversa.Segundo Marques&Marques, o coeficiente de correlação pode ser avaliado qualitativamente da seguinte forma:

- se , não existe correlação linear;- se existe fraca correlação linear;- se existe moderada correlação linear;- se existe forte correlação linear;- se existe fortíssima correlação linear;- se existe correlação linear perfeita.

Exemplo: A tabela seguinte fornece valores das variáveis X (poder calorífico) e (percentagem de cinzas) de certo combustível. Calcular o coeficiente de correlação linear de Pearson e construir o diagrama de dispersão.

X 13100 11200 9300 7400 5300Y 20,5 25,3 32,1 38,0 44,0

No Microsoft Excel: digite na barra de fórmulas “=CORREL(A8:E8;A9:E9)”r = - 0.99889, ou seja, fortíssima correlação linear inversa.Conclusão:

Gráfico: ASSISTENTE DE GRÁFICO >> DISPERSÃO XY

TESTES DE HIPÓTESES ACERCA DO COEFICIENTE DE CORRELAÇÃO LINEARQuando se calcula o coeficiente de correlação linear r, na realidade, está se estimando, através de uma amostra de tamanho n, o verdadeiro coeficiente de correlação linear populacional p. Evidentemente, sob esse aspecto, o tamanho da amostra exerce um papel fundamental na estimativa de p. Utilizando testes adequados pode-se testar se o valor de r, juntamente com o n correspondente, fornece resultado que permite concluir se realmente existe correlação linear significativa entre as variáveis.Para a aplicação do teste de hipóteses acerca do coeficiente de correlação é necessário que as variáveis envolvidas possuam uma distribuição normal bivariada. Esta suposição de normalidade é imprescindível para pequenas amostras e diminui de importância a medida que a amostra aumenta de tamanho.No caso de teste bilateral

Onde a estatística do teste é dada por ,

Onde t segue uma distribuição t de Student com graus de liberdade.

Para a hipótese

Utiliza-se a estatística:

onde e

Como Z tem distribuição aproximadamente normal, então a variável padronizada z será dada por

Tecnologia em Alimentos – 2º período.Estatística aplicada – Prof. Diogo Heron Macowski.

REGRESSÃO

Muitas vezes estudamos certos fenômenos que envolvem duas ou mais variáveis, e freqüentemente estamos interessados em estabelecer uma relação funcional entre as mesmas. O problema da regressão consiste em determinar a função que exprime essa relação.Quando o problema envolve apenas duas variáveis ele é conhecido como regressão simples, e no caso se mais variáveis por regressão múltipla.Seja Y uma variável que sofre influência das variáveis X1 , X2 , ... , Xn , então,

onde: X é a variável independenteY é a variável dependente

é a componente aleatória da variação de Yf é a função de regressão

REGRESSÃO LINEAR SIMPLES

O modelo estatístico de uma regressão linear simples é do tipo

onde e são parâmetros da regressão, sendo denominado coeficiente de regressão linear.

Ao estabelecer o modelo de regressão linear simples, deve-se pressupor que:

1º) A relação entre X e Y é linear

2º) A variável X não é aleatória, ou seja, os valores de X são fixos.

3º) E( )=0, ou seja, a média do erro é nula.

4º) A variância de é sempre .

5º) Os erros são independentes.

6º) Os erros têm distribuição normal.

O estimador para a regressão linear simples é dado por y = A + Bx, onde B estima o coeficiente de regressão .

O método utilizado para a determinação dos estimadores A e B é conhecido por Método dos mínimos quadrados (MMQ), que consiste em tomar como estimativas os valores que minimizam a soma dos desvios.

desta forma, deve-se ter

Simplificando as equações acima obtém-se o denominado sistema de equações normais

Exemplo: Foi realizada uma experiência relacionando os alongamentos de uma mola com cargas aplicadas. Os resultados obtidos foram:Cargas (kg) 3 4 5 6 7 8 9 10Alongamento (cm) 4 4,8 5,6 6,7 7,9 9 9,8 11Determinar:

a) a equação de regressão linear.b) O alongamento da mola se a carga aplicada for de 6,5kgc) Determine a carga necessária para produzir um alongamento de 6 cm.

ANÁLISE DA VARIÂNCIA APLICADA À REGRESSÃO LINEAR SIMPLES

A ANOVA aplicada à regressão linear simples possibilita testar a existência de regressão linear significativa o que equivale a mostrar que o coeficiente de regressão O desenvolvimento da ANOVA nesse caso possibilita montar o seguinte quadro:

Fonte devariação

Soma dequadrados

GL Quadradomédio

EstatísticaF

Devido à regressão

b.Sxy 1 b.Sxy

Residual Syy - b.Sxy n – 2

total Syy n – 1

Onde:

As hipóteses testadas são: (a regressão linear não é significativa) ( a regressão linear é significativa)

Se com e , rejeita-se

Exemplo: Testar pela ANOVA a existência de regressão linear, para os dados do exemplo anterior, ao nível de 5%.

Tecnologia em Alimentos – 2º período.Estatística aplicada – Prof. Diogo Heron Macowski.

LISTA DE EXERCÍCIOS SOBRE CORRELAÇÃO E REGRESSÃO

A lista contém apenas 2 exercícios que possuem 2 partes, devendo a segunda ser realizada no Microsoft Excel.A data de entrega: 19/06/2007.Obs.: levem a sério o trabalho computacional pois perguntas sobre a utilização dos recursos do Excel farão parte da prova.

Questão 01 – Uma das variáveis estudadas no desenvolvimento de um novo produto foi a acidez titulável. Este estudo foi realizado e os resultados estão inseridos na tabela abaixo:TABELA 1 – ACIDEZ TITULÁVEL PARA TRATAMENTO B EM GRAUS DORNIC SEGUNDO

TEMPO DE MATURAÇÃO           repetições tempo 0 tempo 4 tempo 6 tempo 8 tempo 10

1 19 51 78 67 802 19 57 70 69 823 21 53 74 69 974 19 63 72 76 935 19 55 67 74 866 19 59 72 76 86

médias          

Utilizando as médias da acidez titulável em cada tempo de maturação, determine o que se pede:PARTE 1

a) Esboce o diagrama de dispersão dos pontos;b) Determine o coeficiente de correlação linear e explique seu resultado;c) Verifique a existência de correlação linear positiva na população;d) Verifique se a correlação linear é fortíssima na população;e) Determine a equação de regressão linear;f) Insira a reta obtida no diagrama de dispersão do item (a);g) Utilize ANOVA para comprovar que a regressão linear é significativa.h) Determine a acidez no tempo 2.

PARTE 2 - COMPUTACIONAL:i) Construa um gráfico que contenha a dispersão das médias e adicione a linha de

tendência adequada;j) Insira no gráfico produzido a equação de regressão linear simples e a determinação

R2;k) Determine a correlação de Pearson;l) O que significa a determinação R2 e qual sua relação com r (correlação de

Pearson)?

Questão 02 – Para os dados da tabela abaixo, determine:X Y

0 41 -12 -23 -3,54 -1,55 2,5

PARTE 1 a) Construa um diagrama de dispersão b) Utilize teste de hipóteses para confirmar a inexistência de correlação linear;c) Determine uma equação regressão para os pontos.

PARTE 2 - COMPUTACIONAL.d) Coloque em um único gráfico, a dispersão dos pontos, o ajuste linear com sua

equações e o valor de R2, o ajuste polinomial de grau 2 e seu respectivo valor R2.e) Explique os resultados de R2, obtidos em (d);f) Utilize ANOVA para concluir sobre a existência de regressão linear simples.

ANEXOS:

TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO

TABELA DA DISTRIBUIÇÃO T-STUDENT

TABELA DA DISTRIBUIÇÃO QUI-QUADRADO

TABELA DA DISTRIBUIÇÃO F DE SNEDECOR 0,01

TABELA DA DISTRIBUIÇÃO F DE SNEDECOR 0,05

TABELA DA DISTRIBUIÇÃO F DE SNEDECOR 0,10