71
Andando na Superfície de resposta Prof a Daniele Toniolo Dias F. Rosa http://paginapessoal.utfpr.edu.br/danieletdias [email protected] Universidade Tecnológica Federal do Paraná Programa de Pós-Graduação em Engenharia Mecânica - PPGEM

Andando na Superfície de resposta

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Andando na Superfície de resposta

Andando na Superfície de resposta

Profa Daniele Toniolo Dias F. Rosa

http://paginapessoal.utfpr.edu.br/danieletdias

[email protected]

Universidade Tecnológica Federal do Paraná Programa de Pós-Graduação em Engenharia Mecânica - PPGEM

Page 2: Andando na Superfície de resposta

Sumário

• Metodologia de superfície de resposta

• (a) Modelagem inicial

• (b) Como determinar o caminho de máxima inclinação

• (c) Localização do ponto ótimo

• A importância do planejamento inicial

• Um experimento com três fatores e duas respostas

• Planejamentos compostos centrais

Page 3: Andando na Superfície de resposta

Metodologia de superfícies de resposta

• A metodologia de superfícies de resposta (ou RSM, de Response Surface Methodology) é uma técnica de otimização baseada em planejamentos fatoriais que foi introduzida por G. E.P. Box nos anos cinquenta.

• A RSM tem duas etapas distintas – modelagem e deslocamento-, que são repetidas tantas vezes quantas forem necessárias, com o objetivo de atingir uma região ótima da superfície investigada.

• A modelagem normalmente é feita ajustando-se modelos simples (lineares ou quadráticos) a respostas obtidas com planejamentos fatoriais ou com planejamentos fatoriais ampliados.

Page 4: Andando na Superfície de resposta

• O deslocamento se dá sempre ao longo do caminho de máxima inclinação de um determinado modelo, que é a trajetória na qual a resposta varia de forma mais pronunciada.

• Exemplo numérico:

• Supondo que um pesquisador esteja avaliando o efeito de dois fatores, concentração de um reagente e velocidade de agitação, no rendimento de uma reação.

• Ele já sabe que o processo vem funcionando há algum tempo com os valores desses fatores fixados em 50% e 100 rpm, e que os rendimentos médios são obtidos em torno de 68%.

• Agora ele gostaria de saber se não seria possível melhorar o rendimento, escolhendo outros níveis para os fatores.

Page 5: Andando na Superfície de resposta

(a) Modelagem inicial • O 1º passo, para atacar o problema, é investigar a superfície

de resposta em torno das condições habituais de funcionamento do processo, usando um:

• Planejamento fatorial de dois níveis com ponto central.

Com três níveis podemos verificar se há ou não falta de ajuste para um modelo linear.

Page 6: Andando na Superfície de resposta

• A Tabela 6.1 mostra a matriz de planejamento e os rendimentos observados experimentalmente em cada combinação de níveis.

• Ao todo foram realizados 7 ensaios com 3 repetições no ponto central.

Page 7: Andando na Superfície de resposta

• Começaremos nossa análise admitindo que a superfície de resposta na região investigada é uma função linear dos fatores.

• Portanto a resposta pode ser estimada pela equação:

em que b0, b1 e b2 são os estimadores dos parâmetros do modelo e x1 e x2 representam os fatores codificados.

• É visto no Exercício 5.4, que os valores de b0, b1 e b2 podem ser obtidos pelo método dos mínimos quadrados.

• Neste caso a matriz X será dada por

,ˆ 22110 xbxbby (6.1)

.

001

001

001

111

111

111

111

X

A 1ª coluna corresponde ao termo b0, e as outras duas contêm os valores codificados dos fatores.

Page 8: Andando na Superfície de resposta

• Teremos também

• Seguindo o procedimento usual, calculamos

• Usando a Eq. (5.12) temos então

.

69

66

68

67

78

59

69

y

400

040

007

XXt

17

21

467

yXt

e

25,4

25,5

00,68

17

21

476

4/100

04/10

007/11

yXXXbtt

(6.2)

Page 9: Andando na Superfície de resposta

• Dos três ensaios repetidos no ponto central, calculamos s2=2,33 como uma estimativa da variância das observações.

• Substituindo este valor na Eq. (5.30), obtemos uma estimativa da variância dos elementos do vetor b:

• Fazendo as raízes quadradas chegaremos aos erros padrão de b0, b1 e b2. Com eles e com as estimativas obtidas na Eq. (6.2) podemos finalmente escrever a equação do modelo ajustado:

• O tamanho relativamente pequeno dos erros indica que este modelo é significativo (para um tratamento quantitativo, veja os Exercícios 6.2 e 6.4).

• A análise da variância encontra-se na Tabela 6.2.

.

58,000

058,00

0033,0

33,2

4/100

04/10

007/1

ˆ 21

stXXbV

.25,425,500,68ˆ

76,02

76,01

58,0

xxy (6.3)

Page 10: Andando na Superfície de resposta

• Como o valor de MQfaj/MQep não é estatisticamente significativo (0,42/2,34=0,18), não há evidência de falta de ajuste.

• Tabela 6.2 ANOVA para o ajuste do modelo aos dados da Tabela 6.1. (n=7, p=3 e m=5)

Fonte de variação

Soma Quadrática

No de g. l. Média Quadrática

Regressão 182,50 p-1= 2 91,25

Resíduos 5,50 n-p= 4 1,38

F. Ajuste 0,83 m-p= 2 0,42

Erro puro 4,67 n-m= 2 2,34

Total 188,00 n-1= 6

% de variação explicada: 97,07% % máxima de variação explicável:97,52

22110ˆ xbxbby

R2=SQR/SQT coef. de determinação

(SQT – SQep)/SQT

Page 11: Andando na Superfície de resposta

• Na região investigada, a superfície de resposta é descrita satisfatoriamente pela Eq. (6.3), que define o plano representado em perspectiva na figura abaixo.

• Plano descrito pela Eq. (6.3), .25,425,500,68ˆ 21 xxy

Sentido ascendente

C

v

Page 12: Andando na Superfície de resposta

Exercícios 6.1, 6.2, 6.3 e 6.4

Page 13: Andando na Superfície de resposta

• Podemos obter uma representação bidimensional da superfície modelada desenhando suas curvas de nível, que são linhas em que a resposta é constante.

• As curvas de nível de um plano são segmentos de retas.

• Por ex, se fizermos na Eq. (6.3) chegaremos à expressão:

que descreve uma reta sobre a qual o valor de deve ser igual a 70, de acordo com o modelo ajustado.

• Fazendo o mesmo para outros valores de obteremos outras curvas de nível, que em conjunto darão uma imagem da superfície de resposta na região investigada (ver próxima Fig).

• Podemos ver claramente, tanto numa figura quanto na outra, que se trata de um plano inclinado obliquamente em relação aos eixos, e com sentido ascendente indo da direita para a esquerda.

,47,024,1 12 xx

70ˆ y

y

y

Page 14: Andando na Superfície de resposta

• Assim se desejarmos obter maiores rendimentos, devemos deslocar a região experimental para menores valores de x1 e maiores valores de x2.

• Curvas de nível do plano descrito pela Eq. 6.3. Os valores entre parênteses são as respostas determinadas experimentalmente.

O progresso será mais rápido se o deslocamento for realizado ao longo da uma trajetória perpendicular às curvas de nível, isto é, se seguirmos um caminho de máxima inclinação da superfície ajustada.

Page 15: Andando na Superfície de resposta

(b) Como determinar o caminho de máxima inclinação

• O caminho de máxima inclinação saindo do ponto central do planejamento está indicado pela linha tracejada na figura anterior.

• Ele pode ser determinado algebricamente a partir dos coeficientes do modelo.

• Para termos a máxima inclinação, devemos fazer deslocamentos ao longo dos eixos x2 e x1 na proporção b2/b1.

• Da Eq. 6.3 temos b2/b1=4,25/(-5,25)=-0,81, o que significa que para cada unidade recuada no eixo x1 devemos avançar 0,81 unidades ao longo do eixo x2.

Page 16: Andando na Superfície de resposta

• As coordenadas de vários pontos ao longo dessa trajetória estão na Tabela 6.3, tanto nas variáveis codificadas quanto nas unidades reais de concentração e velocidade de agitação.

• Tabela 6.3 Caminho de máxima inclinação para o modelo das figuras anteriores.

Etapa x1 x2 C(%) v(rpm) y(%)

Centro 0 0,00 50 100,0 68, 66, 69

Centro+ -1 0,81 45 108,1 77

Centro+2 -2 1,62 40 116,2 86

Centro+3 -3 2,43 35 124,3 88

Centro+4 -4 3,24 30 132,4 80

Centro+5 -5 4,05 25 140,5 70

Obtida pela Eq (6.3) usando as codificações de máxima

inclinação

Page 17: Andando na Superfície de resposta

• Podemos traçá-lo usando o seguinte procedimento:

1. Escolhemos um dos fatores, digamos i, como base e mudamos seu nível numa certa extensão, para mais ou para menos, dependendo do sinal de seu coeficiente e do objetivo do experimento – maximização ou minimização da resposta. Recomenda-se escolher o fator de maior coeficiente, em módulo, no modelo ajustado. Tipicamente, o seu deslocamento inicial é de uma unidade (na escala codificada).

2. Determinamos os deslocamentos dos outros fatores ji, em unidades codificadas, através de

3. Convertemos os deslocamentos codificados de volta às unidades originais, e determinamos os novos níveis dos fatores.

ii

jj x

b

bx (6.4)

Page 18: Andando na Superfície de resposta

• Vejamos um exemplo com 3 fatores: Num estudo para avaliar a influência de alguns nutrientes na produção de quitina pelo fungo Cunninghamella elegans (Andrade et al., 2000) utilizou-se um planejamento fatorial 23 com os níveis da Tabela 6.4, cujos resultados se ajustaram ao modelo

em que a resposta y é o teor de quitina produzido.

• Tabela 6.4 Níveis de um planejamento 23 com ponto central, para estudar como o teor de quitina produzido pelo fungo varia com as concentrações de glicose, asparagina e tiamina no meio de cultura.

Fator Nível

-1 0 +1

G(x1) D-glicose (g L-1) 20 40 60

A(x2) L-asparagina (g L-1) 1 2 3

T(x3) Tiamina (mg L-1) 0,02 0,05 0,08

,5,20,50,28,19ˆ 321 xxxy (6.5)

Page 19: Andando na Superfície de resposta

• Como os coeficientes do modelo são todos positivos e o objetivo do estudo era maximizar a produção de quitina, devemos aumentar os níveis de todos os fatores.

• Partindo do fator x2 (o de maior coeficiente) teríamos, como deslocamentos para localizar o 1º ponto ao longo do caminho de máxima inclinação,

• Nas unidades verdadeiras, onde o ponto central é dado por (G, A, T)=(40, 2, 0,05), isto corresponde às seguintes condições experimentais:

4,015

21 x 1)1(

5

52 x 5,01

5

5,23 x

1

1 48204,04040G gLGx

1

2 31122A gLAx

1

3 065,003,05,005,005,0T mgLTx

,i

i

j

j xb

bx

321 5,20,50,28,19ˆ xxxy Lembrando que:

Page 20: Andando na Superfície de resposta

Exercício 6.5

• Imagine que, no exemplo da C. elegans, os pesquisadores tenham preferido tomar a concentração de glicose como fator de partida para determinar o caminho de máxima inclinação, com um deslocamento inicial de +25 gL-1 (note que estas são as unidades reais). Calcule as coordenadas do 3º ponto ao longo do novo caminho, e use a Eq. 6.5 para fazer uma estimativa do rendimento de quitina nessas condições.

Page 21: Andando na Superfície de resposta

• Voltamos agora ao 1º exemplo.

• Tendo realizado a modelagem inicial e determinado o caminho de máxima inclinação, passamos à etapa de deslocamento ao longo desse caminho.

• E vamos realizando experimentos nas condições especificadas na Tabela 6.3.

• Com isso obtemos os resultados da última coluna da tabela, que também estão indicados na próxima figura.

Page 22: Andando na Superfície de resposta

• Resultados dos ensaios realizados na trajetória de máxima inclinação da figura anterior.

• Inicialmente os rendimentos aumentam, mas depois do 3º ensaio começam a diminuir.

“morro”

Page 23: Andando na Superfície de resposta

• Podemos interpretar esses resultados imaginando que a superfície de resposta é como um morro.

• Pelos valores iniciais, começamos a nos deslocar ladeira acima, mas depois do 3º ensaio já estamos começando a descer o morro pelo lado oposto.

• É hora, portanto, de parar com os deslocamentos e examinar a região que apresentou melhores rendimentos.

• Para isso fazemos um novo planejamento, idêntico ao primeiro, porém centrado em torno do melhor ensaio, que é o terceiro (35 % e cerca de 125 rpm).

• A nova matriz de planejamento é apresentada na Tabela 6.5, juntamente com as novas respostas observadas.

Page 24: Andando na Superfície de resposta

• Resultados de um novo planejamento 22 com ponto central. x1 e x2 agora representam os valores das variáveis codificadas pelas equações x1 = (C-35)/5 e x2 =(v-125)/10.

• O ajuste de um modelo linear aos dados da Tabela 6.5 resulta na equação

onde os erros padrão foram calculados a partir de uma estimativa conjunta da variância, combinando os ensaios repetidos dos dois planejamentos.

Ensaio C(%) v(rpm) x1 x2 Y(%)

1 30 115 -1 -1 86

2 40 115 1 -1 85

3 30 135 -1 1 78

4 40 135 1 1 84

5 35 125 0 0 90

6 35 125 0 0 88

7 35 125 0 0 89

,25,225,171,85ˆ

65,02

65,01

49,0

xxy (6.6)

Page 25: Andando na Superfície de resposta

Exercício 6.6

• Use os erros dos coeficientes na Eq. 6.6 para calcular intervalos de 95% de confiança para 0, 1 e 2. Esses parâmetros são estatisticamente significativos?

• Em comparação com os valores dos coeficientes, os erros são bem mais importantes do que no caso da Eq. (6.3), e a dependência linear da resposta em relação a x1 e x2 já não parece segura.

Page 26: Andando na Superfície de resposta

• A Tabela 6.6, mostra que a situação agora é bem diferente.

• E o valor de MQfaj/MQep subiu para 34,46 que é maior que F2,2 (19,0 no nível de 95 % de confiança). Portanto,

• na região onde o caminho de máxima inclinação indicou, o modelo linear não descreve a superfície de resposta.

• Tabela 6.6 ANOVA para o ajuste do modelo aos dados da Tabela 6.5.

Fonte de variação Soma Quadrática No de g. l. Média Quadrática

Regressão 26,50 2 13,25

Resíduos 70,93 4 17,73

F. Ajuste 68,93 2 34,46

Erro puro 2,00 2 1,00

Total 97,42 6

% de variação explicada: 27,20% % máxima de variação explicável:97,95

22110ˆ xbxbby

Page 27: Andando na Superfície de resposta

(c) Localização do ponto ótimo

• Como o modelo linear não serve mais, devemos partir para um modelo quadrático, cuja expressão geral para duas variáveis é:

• Este modelo tem seis parâmetros, e o nosso planejamento tem apenas 5 “níveis” (5 diferentes combinações de valores da concentração e da velocidade de agitação).

• Como não é possível determinar as estimativas quando há mais parâmetros do que níveis, precisamos ampliar o planejamento.

• A ampliação pode ser feita de várias maneiras, sendo a mais comum a construção do chamado planejamento em estrela.

.ˆ 21122

2222

11122110 xxbxbxbxbxbby (6.7)

Page 28: Andando na Superfície de resposta

• Para fazer um planejamento em estrela, acrescentamos ao planejamento inicial um planejamento idêntico, porém girado de 45 graus em relação à orientação de partida.

• O resultado é uma distribuição octogonal (ver figura abaixo).

• Planejamento em estrela para duas variáveis codificadas, correspondente à tabela 6.7.

Os novos pontos, assim como os primeiros, estão a uma distância de unidades codificadas do ponto central. Todos eles estão sobre uma circunferência de raio

2

.2

Page 29: Andando na Superfície de resposta

Coordenadas dos pontos em estrela.

Valores já mostrados na Tabela 6.5.

Page 30: Andando na Superfície de resposta

• O vetor y agora terá onze valores, e a matriz X terá dimensões 11 X 6, com suas seis colunas correspondendo aos seis termos do modelo quadrático.

• Para obter as colunas referentes a x12, x2

2 e x1x2, elevamos ao quadrado ou multiplicamos as colunas apropriadas na matriz de planejamento da Tabela 6.7. Assim podemos escrever

020201

002021

020201

002021

000001

000001

000001

111111

111111

111111

111111

X

87

86

80

81

89

88

90

84

78

85

86

ye

Page 31: Andando na Superfície de resposta

• Resolvendo as Eqs. (5.12) (algoritmo para os coeficientes) e (5.30) (algoritmo para a variância dos coeficientes), obtemos:

• Os erros padrão foram novamente calculados a partir de uma estimativa conjunta da variância, obtida de todos os ensaios repetidos, inclusive os da Tabela 6.1.

• A nova análise da variância está na Tabela 6.8.

.75,181,281,236,225,100,89ˆ

65,021

54,0

22

54,0

21

46,02

46,01

75,0

xxxxxxy (6.8)

Page 32: Andando na Superfície de resposta

• O valor de MQfaj/MQep agora é apenas 0,25, não havendo evidência de falta de ajuste do modelo quadrático.

• Isto quer dizer que o valor de 0,55 para a média quadrática residual total, MQr, também poderia ser usado como uma estimativa da variância, com cinco graus de liberdade.

• Tabela 6.8 ANOVA para o ajuste do modelo aos dados da Tabela 6.7.

Fonte de variação Soma Quadrática No de g. l. Média Quadrática

Regressão 144,15 5 28,83

Resíduos 2,76 5 0,55 =s2

F. Ajuste 0,76 3 0,25

Erro puro 2,00 2 1,00

Total 146,91 10

% de variação explicada: 98,12% % máxima de variação explicável:98,64

22110ˆ xbxbby

21122

2222

111 xxbxbxb

Page 33: Andando na Superfície de resposta

• (a) Superfície quadrática descrita pela Eq.(6.7). (b) Suas curvas de nível. O rendimento máximo (89,6%) ocorre em x1=0,15 e x2=-0,37 (C=3 6% e v=121 rpm).

Valor de acordo com a Eq. (6.8). E representa uma melhora de 32 % em relação ao valor de partida, que era 68 %.

Page 34: Andando na Superfície de resposta

• Como localizamos a região do máximo, a investigação termina por aqui.

• Poderia ter acontecido, no entanto, que a superfície de resposta ajustada aos dados segundo planejamento fosse uma nova ladeira, em vez de pico.

• Nesse caso, deveríamos nos deslocar novamente, seguindo o novo caminho de máxima inclinação, e repetir todo o processo de modelagem deslocamento modelagem... Até atingir a região procurada.

• Na prática não deve haver muitas dessas etapas, porque o modelo linear se torna menos eficaz à medida que nos aproximamos de um ponto extremo, onde a curvatura da superfície evidentemente passará a ter importância.

Page 35: Andando na Superfície de resposta

Exercícios 6.7 e 6.8

• Use os dados da Tabela 6.8 para calcular um valor que mostre que a Eq. 6.8 é estatisticamente significativa.

• Uma representação gráfica, embora seja sempre conveniente, não é necessária para localizarmos o ponto máximo de uma superfície de resposta. Isso pode ser feito derivando-se a equação do modelo em relação a todas as variáveis e igualando-se as derivadas a zero. (a) Use esse procedimento para a Eq. 6.8, para confirmar os valores citados no texto. (b) O que aconteceria se você tentasse fazer o mesmo com a Eq. 6.6? Por quê?

Page 36: Andando na Superfície de resposta

A importância do planejamento inicial

• Uma questão muito importante na RSM é a escolha da faixa inicial de variação dos fatores, que determinará o tamanho do primeiro planejamento e consequentemente a escala de codificação e a velocidade relativa com que os experimentos seguintes se deslocarão ao longo da superfície de resposta.

• Suponhamos, por ex., que na Tabela 6.1 tivéssemos escolhido para o segundo fator – a velocidade de agitação - os limites de 95 e 105 rpm (ao invés de 90 e 110). Essa decisão teria as seguintes consequências:

Page 37: Andando na Superfície de resposta

1. O coeficiente de x2 na Eq. 6.3 se reduziria de 4,25 para 2,125, porque a variação unitária em x2 agora corresponderia, em unidades reais, a 5 rpm, e não mais a 10 rpm.

2. Com este novo coeficiente teríamos, na Eq. (6.4),

3. Consequentemente, o deslocamento x2 correspondente a x1 =-1 seria +0,405, que equivaleria agora a v=+0,4055= 0,203 rpm. Ou seja: em termos da velocidade de agitação, cada deslocamento seria apenas um quarto do deslocamento do planejamento original. Quando chegássemos à etapa Centro+5, ainda estaríamos com uma velocidade de 110,1 rpm.

.405,025,5

125,2112 xxx

Page 38: Andando na Superfície de resposta

• Se, ao contrário, tivéssemos preferido uma escala mais ampliada, evidentemente o deslocamento passaria a ser mais rápido. No entanto, também estaríamos correndo riscos.

• Dependendo da ampliação, poderíamos sair da região linear da superfície, ou mesmo encontrar “o outro lado do morro” já no 1º deslocamento, e assim perder a oportunidade de descobrir a direção do ponto ótimo.

• Como fazer, então para determinar a melhor escala?

Page 39: Andando na Superfície de resposta

• Infelizmente a resposta não está em nenhum livro de estatística, porque depende de cada problema, e muitas vezes não pode ser conhecida a priori.

• Os pesquisadores devem apoiar-se em todo o conhecimento disponível sobre o sistema em estudo e procurar escolher deslocamentos nem tão pequenos que não produzam efeitos significativos na resposta, nem tão grandes que varram faixas exageradas dos fatores.

• Deve-se fazer os experimentos de forma sequencial e iterativa.

• Caso a análise dos primeiros resultados nos leve a fazer modificações nos planejamentos originais, o prejuízo será menor se não nos apressarmos em fazer muitos experimentos logo de saída.

Page 40: Andando na Superfície de resposta

Um experimento com três fatores e duas respostas

• Na metodologia de superfícies de resposta o número de fatores não é uma restrição, nem o número de respostas.

• A RSM pode ser aplicada a qualquer número de fatores, assim como pode modelar várias respostas ao mesmo tempo.

• Esta é uma característica importante, porque muitas vezes um produto ou processo tem de satisfazer mais de um critério, como digamos, apresentar o máximo de rendimento com o mínimo de impurezas, ou ter custo mínimo porém mantendo os parâmetros de qualidade dentro das especificações.

Page 41: Andando na Superfície de resposta

• Para ilustrar essa flexibilidade da RSM, será apresentada uma aplicação real, cujo objetivo era a maximização simultânea de duas respostas distintas.

• R. A. Zoppi (Unicamp), realizou uma série de experimentos de síntese de polipirrol numa matriz de borracha de EPDM.

• O polipirrol é um polímero condutor mas é muito quebradiço, o que prejudica o seu uso em aplicações de interesse prático.

• O objetivo era conseguir um produto que tivesse ao mesmo tempo propriedades elétricas semelhantes às do polipirrol e propriedades mecânicas parecidas com as da borracha EPDM.

EPDM – Etileno Propileno Dieno

Page 42: Andando na Superfície de resposta

• Os fatores escolhidos para o estudo foram o tempo de reação (t), a concentração do agente oxidante (C) e a granulometria das partículas do oxidante (P).

• O pesquisador (que não tinha instrução formal em técnicas de planejamento de experimentos) decidiu realizar 27 ensaios em quadruplicata, seguindo o planejamento fatorial 33 da Tabela 6.9.

• Para cada ensaio foram registrados o rendimento da reação e os valores de várias propriedades mecânicas do produto final, entre as quais o Módulo de Young.

Page 43: Andando na Superfície de resposta

A respostas são as médias e os desvios padrão dos quatro ensaios (em alguns casos três) realizados para cada combinação de níveis dos fatores, num total de 106 ensaios. Observe que o tamanho das partículas não é definido de forma precisa. Os 3 níveis representam intervalos granulométricos, e não tamanhos específicos.

Page 44: Andando na Superfície de resposta

• Após a análise da Tabela 6.9 o pesquisador percebeu que, com 27 ensaios diferentes, pode-se ajustar uma função com até 27 parâmetros.

• As funções lineares e quadráticas de 3 variáveis são definidas por apenas quatro e dez parâmetros, respectivamente.

• Se as usarmos para modelar os dados da tabela, ainda teremos muitos graus de liberdade sobrando para estimar a falta de ajuste.

Page 45: Andando na Superfície de resposta

• Os coeficientes do modelo e seu erros padrão foram calculados como de costume, por meio das equações 5.12 e 5.30.

• Para o Módulo de Young, o emprego do modelo linear resultou na equação

enquanto o modelo quadrático produziu a Eq. 6.10:

,15,074,001,013,1ˆ

04,004,004,003,0

PCtM

.18,001,007,005,044,002,016,074,001,086,0ˆ

05,005,007,007,0

2

07,0

2

07,0

2

04,004,004,009,0

CPtPtCPCtPCtM

(6.9)

(6.10)

Page 46: Andando na Superfície de resposta

• A análise da variância para os dois ajustes está na Tabela 6.10.

• Os valores de MQR/MQr são 141,5 (linear) e 171,4 (quadrático).

• Comparando com F3,102=2,71 e F9,96=2,00 , no nível de 95% de confiança, vemos que os dois modelos são altamente significativo.

• Tabela 6.10 ANOVA- ajuste de modelos linear e quadráticos (em parênteses) aos valores de M dados na Tabela 6.9. Fonte de variação Soma Quadrática No de g. l. Média Quadrática

Regressão 37,34 (43,23) 3 (9) 12,45 (4,80)

Resíduos 8,44 (2,55) 102 (96) 0,088 (0,028)

F. Ajuste 6,76 (0,87) 23 (17) 0,29 (0,051)

Erro puro 1,68 79 0,023

Total 45,78 105

% de variação explicada: 81,56% (94,43) % máxima de variação explicável:96,33

Page 47: Andando na Superfície de resposta

• Embora não pareça haver muita diferença entre os dois modelos, um exame mais detalhado da Tabela 6.10 mostra que devemos preferir o modelo quadrático.

• Enquanto para o modelo linear a razão MQfaj/Mqep é igual a 12,61, valor bem superior a F23,79=1,67, o modelo quadrático tem MQfaj/Mqep =2,22, que está apenas um pouco acima de F17,79=1,75.

• A diferença entre os modelos fica ainda mais evidente nos gráficos dos resíduos (próxima figura).

Page 48: Andando na Superfície de resposta

• (a) Resíduos deixados pelo ajuste de um modelo linear aos valores do M dados na Tabela 6.9. (b) Resíduos deixados pelo ajuste de um modelo quadrático aos mesmos dados.

• (a) apresenta uma curvatura. Os valores passam de positivos para negativos e depois se tornam positivos novamente.

• (b) os resíduos parecem flutuar aleatoriamente em torno de 0

• (a) e (b) a variância residual aumenta com o valor da resposta.

Page 49: Andando na Superfície de resposta

• A preferência pelo modelo quadrático é confirmada pelos valores dos coeficientes de C2 e CP na Eq. (6.10), 0,44 e -0,18.

• Eles são significativamente superiores aos seu erros padrão e os dois termos devem ser incluídos no modelo.

• Como eles estão ausentes no modelo linear, o gráfico dos resíduos apresenta um comportamento sistemático.

• Após a validação estatística do modelo, podemos tentar interpretar a Eq. 6.10, para entender melhor o comportamento do Módulo de Young (propriedades mecânicas) das amostras em questão.

05,005,007,007,0

2

07,0

2

07,0

2

04,004,004,009,0

18,001,007,005,044,002,016,074,001,086,0ˆ CPtPtCPCtPCtM

Page 50: Andando na Superfície de resposta

• Os resultados mostram que o Módulo de Young só depende da concentração do oxidante e do tamanho de suas partículas (Exercício 6.10).

• Nenhum dos termos envolvendo o tempo de reação é estatisticamente significativo.

• Numa primeira aproximação, portanto, podemos eliminar os termos em t, reduzindo o modelo a

• A forma da superfície de resposta gerada por esta expressão é revelada pela próxima figura.

• Trata-se de uma espécie de vale, situado quase perpendicular ao eixo das concentrações.

.18,044,016,074,086,0ˆ

05,007,0

2

04,004,009,0

CPCPCM (6.11)

Page 51: Andando na Superfície de resposta

• (a) Superfície de resposta descrita pela Eq. 6.11, que relaciona o Módulo de Young com a concentração e a granulometria do oxidante. (b) Curvas de nível para a superfície do item (a). Os valores entre parênteses são as respostas médias observadas.

Page 52: Andando na Superfície de resposta

Exercícios 6.9 e 6.10

• Use os dados da Tabela 6.10 para calcular uma estimativa do erro experimental com mais de 79 graus de liberdade.

• Sabendo que a estimativa do erro padrão foi obtida a partir do valor de MQep na Tabela 6.10, determine, no nível de 95% de confiança, quais são os coeficientes estatisticamente significativos na Eq. (6.10).

Page 53: Andando na Superfície de resposta

• A utilidade da Eq. (6.11) e da superfície é nos ajudar a prever que condições experimentais resultarão num valor de interesse para o Módulo de Young.

• A Tabela 6.11 mostra uma comparação dos valores médios observados com os valores previstos pela Eq. (6.11).

• A concordância é muito boa.

Erro médio absoluto não chega a 4 % da faixa de variação da Tabela 6.9.

Page 54: Andando na Superfície de resposta

• Isto comprova que quase toda a variação observada nos valores do Módulo de Young pode ser explicada pelas mudanças feitas na concentração e na granulometria.

• Se o objetivo é obter um produto com um alto valor de M, a figuras anteriores indicam que devemos usar um nível de concentração de cinquenta partes por cem e partículas com granulometria mais fina >150 mesh (partículas menores).

• Caso o modelo possa ser extrapolado, podemos obter valores ainda maiores continuando a aumentar a concentração e a diminuir a granulometria das partículas.

Page 55: Andando na Superfície de resposta

• Para obter pequenos valores de M devemos usar uma baixa concentração de oxidante, cerca de 10 ppc.

• Nesse caso, o tamanho da partícula não tem importância.

• Todos os resultados experimentais obtidos com 10 ppc estão no fundo do vale (granulometria varia sem afetar a resposta).

• Como o tempo de reação não alterou M, podemos usar qualquer valor entre 8 e 24 h.

• Se só estivermos interessados nesta resposta, não precisamos nos importar com o tempo.

Page 56: Andando na Superfície de resposta

• Porém, os pesquisadores também queriam aumentar o rendimento da reação, e fizeram para ele um ajuste semelhante ao M. Daí resultou a equação:

onde somente aparecem os termos estatisticamente significativos. Nessa expressão o tempo é um fator importante.

• Todos os termos em t têm coeficientes positivos, o que significa que tempos mais longos produzirão maiores rendimentos. Colocando o tempo no seu valor máximo:

• A superfície de resposta descrita por esta expressão está representada na próxima figura.

,26,128,147,181,693,124,9ˆ 2 tCCPCtR

.28,147,107,817,11ˆ 2CPCR (6.12)

Page 57: Andando na Superfície de resposta

• Superfície de resposta e curvas de nível para a Eq. 6.12, mostrando o rendimento após 24 h de reação, em função da concentração (C) e da granulometria do oxidante (P).

• Comparando com as anteriores podemos constatar que a região que produz altos M (canto inferior direito do gráfico de curvas de nível) também produz altos rendimento.

• E no fundo do vale: valores de M da ordem de 0,50 MPa correspondem a rendimentos baixos, de cerca de 5 %.

Page 58: Andando na Superfície de resposta

• O planejamento descreveu adequadamente as superfícies de resposta na região estudada, mas poderíamos chegar às mesmas conclusões com um planejamento mais econômico.

• Inicialmente, poderíamos fazer um planejamento fatorial com apenas dois níveis e tentar demarcar uma região de fatores para um estudo mais detalhado.

• Dependendo dos resultados poderíamos:

(a) ampliar o planejamento inicial com mais ensaios para transformá-lo num planejamento em estrela, ou

(b) deslocar os experimentos para uma região mais promissora, a ser investigada com um novo fatorial.

• Entretanto os experimentos apresentados foram feitos de acordo com um planejamento sistemático, que permitiu caracterizar a influência dos fatores investigados.

• Esse modo de proceder é superior à maneira intuitiva que ainda prevalece em muitos laboratórios de pesquisa.

Page 59: Andando na Superfície de resposta

Planejamentos compostos centrais

• O planejamento em estrela é um exemplo de planejamento composto central para dois fatores.

Page 60: Andando na Superfície de resposta

Planejamentos compostos centrais

• Em geral, um planejamento composto central para k fatores, devidamente codificados como (x1,..., xk), é formado de três partes:

1. Uma parte chamada de fatorial (ou cúbica), contendo um total de nfat pontos de coordenadas xi=-1 ou xi=+1, para todos os i=1,...,k;

2. Uma parte axial (ou em estrela), formada por nax=2k pontos com todas as coordenadas nulas exceto uma, que é igual a um certo valor (ou -);

3. Um total de ncentr ensaios realizados no ponto central, onde, é claro, x1=...xk=0.

Page 61: Andando na Superfície de resposta
Page 62: Andando na Superfície de resposta

• Para realizar um planejamento composto central, precisamos definir como será cada uma dessas três partes.

• Precisamos decidir quantos e quais serão os pontos cúbicos, qual o valor de , e quantas repetições faremos no ponto central.

• No planejamento da Tabela 6.7, por exemplo, temos k=2.

• A parte cúbica é formada pelos quatro primeiros ensaios, a parte em estrela pelos quatro últimos (com ), e existem três ensaios repetidos no ponto central.

• O caso de três fatores é mostrado na próxima figura, onde podemos perceber a origem da terminologia empregada para as três partes do planejamento.

2

Page 63: Andando na Superfície de resposta

• Planejamento composto central para três fatores. As bolas cinzas são a parte cúbica – os ensaios de um fatorial 23. As bolas pretas representam a parte em estrela.

• Os pontos cúbicos são idênticos ao de um planejamento fatorial de dois níveis.

Parte axial, nax=2k=6

Page 64: Andando na Superfície de resposta

• Na Tabela 6.7 usamos um planejamento fatorial completo, mas isso não seria estritamente necessário.

• Dependendo do número de fatores, poderia nem ser aconselhável, porque produziria um número de ensaios inconvenientemente grande.

• O total de níveis distintos num planejamento composto central é nfat + 2k +1. Lembrando que nfat é o número de pontos da parte fatorial (ou cúbica) do planejamento.

• Portanto para fatorial da Tabela 6.7, nove níveis seriam suficientes.

Page 65: Andando na Superfície de resposta

• O modelo quadrático completo para k fatores é dado pela Eq. 6.13, que contém (k+1)(k+2)/2 parâmetros.

• Com dois fatores, temos 6 parâmetros.

• O planejamento da Tabela 6.7 tem 9 diferentes combinações de níveis, e a rigor poderíamos estimar todos os parâmetros do modelo usando apenas dois pontos cúbicos, correspondentes a uma das duas frações 22-1.

.20

ji jjiij

iiii

iii xxxxy

(6.13)

Page 66: Andando na Superfície de resposta

• Para um 22, a economia é muito pouca e dificilmente justificaria a destruição da simetria da porção cúbica.

• Entretanto, à medida que o número de fatores aumenta, escolher os pontos cúbicos como os de um planejamento fracionário e não de um planejamento completo torna-se cada vez mais indicado.

• Do ponto de vista da resolução, é recomendável usar um fatorial fracionário de resolução V, que permitirá estimar os efeitos principais e as interações de dois fatores com um confundimento relativamente baixo.

• Se decidirmos usar frações menores, porém, a escolha da fração apropriada não é trivial.

• Uma lista das frações mais adequadas pode ser encontrada em Wu e Hamada (2.000), Capítulo 9.

Page 67: Andando na Superfície de resposta

• O valor de costuma ficar entre 1 e . Quando como na Tabela 6.7, os pontos cúbicos e os pontos axiais ficam sobre a superfície de uma (hiper)esfera, e o planejamento é chamado de esférico.

• Na Tabela 6.7, por ex., todos os pontos periféricos estão sobre a mesma circunferência.

k ,k

Page 68: Andando na Superfície de resposta

• No outro extremo, quando =1, os pontos axiais se localizam nos centros das faces do (hiper)cubo definido pela parte cúbica do planejamento.

• Este tipo de planejamento é vantajoso quando o espaço experimental é cúbico, o que ocorre de forma natural quando os fatores são variados independentemente uns dos outros.

• Tem ainda a vantagem de só precisar de três níveis dos fatores, o que pode ser de grande ajuda no caso de algum fator ser qualitativo.

Page 69: Andando na Superfície de resposta

• Se escolhermos estaremos colocando os pontos em estrela cada vez mais distantes do ponto central, à medida que o número de fatores for crescendo.

• Essa escolha deve ser feita com muito cuidado, porque estaremos correndo o risco de deixar a região intermediária sem ser investigada.

• Com nove fatores, por ex., seria igual a 3. Não ficaríamos sabendo de nada sobre o comportamento da superfície de resposta no intervalo 1-3 ao longo de cada eixo.

,k

Page 70: Andando na Superfície de resposta

• Box e Hunter (1957) propuseram o conceito de rotabilidade como critério para escolher o valor de .

• Um planejamento é chamado de rodável se a variância de suas estimativas, , só depender da distância em relação ao ponto central, isto é, se a precisão da resposta prevista for a mesma em todos os pontos situados numa dada (hiper)esfera com centro no próprio centro do planejamento.

yV ˆ

Page 71: Andando na Superfície de resposta

• A Tabela 6.13 mostra como podemos construir planejamentos rodáveis para três (nax =2k= 6) e quatro (nax = 8) fatores.

kCoordenadas: centrais nulas e axiais iguais a