View
227
Download
0
Category
Preview:
DESCRIPTION
Utilizando a quimiometria para classificacao de oleos vegetais
Citation preview
UNIVERSIDADE FEDERAL DA PARABA
CENTRO DE CINCIAS EXATAS E DA NATUREZA
DEPARTAMENTO DE QUMICA
PROGRAMA DE PS-GRADUAO EM QUMICA
DISSERTAO DE MESTRADO
CLASSIFICAO DE LEOS VEGETAIS UTILIZANDO VOLTAMETRIA
DE ONDA QUADRADA E MTODOS QUIMIOMTRICOS
Francisco Fernandes Gambarra Neto
Joo Pessoa PB Brasil
Fevereiro / 2008
UNIVERSIDADE FEDERAL DA PARABA
CENTRO DE CINCIAS EXATAS E DA NATUREZA
DEPARTAMENTO DE QUMICA
PROGRAMA DE PS-GRADUAO EM QUMICA
DISSERTAO DE MESTRADO
CLASSIFICAO DE LEOS VEGETAIS UTILIZANDO VOLTAMETRIA
DE ONDA QUADRADA E MTODOS QUIMIOMTRICOS
Francisco Fernandes Gambarra Neto
Dissertao apresentada como
requisito para a obteno do
ttulo de Mestre em Qumica pela
Universidade Federal da Paraba.
Orientador: Prof. Dr. Mrio Csar Ugulino de Arajo
2 Orientador: Dr. Glimaldo Marino
Bolsista (CAPES)
Joo Pessoa PB Brasil
Fevereiro / 2008
Aos meus pais, Fernando Antnio Casimiro
Gambarra e Ana Maria Fontes Gambarra,
minha av, Maria de Lourdes Casimiro
Fernandes e s minhas irms, Fernanda
Fontes Gambarra e Fabiana Fontes
Gambarra, por todo amor, amizade, apoio,
ajuda e confiana.
minha namorada, Wanessa Porto Tito, por
todo amor, companheirismo e compreenso.
Com muito carinho e gratido,
Eu dedico.
AGRADECIMENTOS
Em primeiro lugar agradeo a Deus por me dar disposio, fora de
vontade e sade para realizar este trabalho.
Aos meus grandes amigos Mrcio Jos Coelho de Pontes e Gledson
Emdio Jos, que esto sempre do meu lado acreditando, ajudando,
debatendo, colaborando e sempre prontos para escutarem e
compartilharem os bons e maus momentos.
Ao Professor Dr. Mrio Csar Ugulino de Arajo, pela orientao,
confiana e por ter apostado em mim.
Aos pesquisadores Dr. Glimaldo Marino e Dr. Everaldo Paulo de
Medeiros, pelo aprendizado, ajuda, incentivo e, principalmente, pela
amizade.
Renato Sousa Lima, pela amizade e ajuda em uma parte do
experimental.
A todos do LAQA, que de uma forma ou de outra, ajudaram-me e
fizeram-me sentir bem-vindo ao laboratrio.
Aos demais professores do LAQA e do Departamento de Qumica, que
me forneceram aprofundamentos disciplinares durante o Mestrado.
Aos Professores Germano Veras e Ana Cludia, pelos conselhos,
amizade e confiana desde a graduao pela Universidade Estadual da
Paraba.
A CAPES pelo fornecimento da bolsa.
ii
SUMRIO
NDICE DE FIGURAS ...................................................................... v
NDICE DE TABELAS ...................................................................... x
LISTA DE ABREVIATURAS E SIGLAS ............................................ xii
RESUMO ...................................................................................... xiv
CAPTULO I INTRODUO ............................................................. 1
1.1 leos Vegetais ......................................................................... 2
1.2 Composio dos leos vegetais .................................................. 3
1.3 leos vegetais e a sade humana ............................................... 5
1.4 Tipos de leos vegetais ............................................................. 6 1.4.1 leo de canola .................................................................... 6 1.4.2 leo de girassol .................................................................. 7 1.4.3 leo de milho ..................................................................... 8 1.4.4 leo de soja ....................................................................... 8
1.5 Controle de qualidade de leos vegetais ..................................... 10
1.6 Voltametria de onda quadrada .................................................. 11
1.7 Quimiometria .......................................................................... 13 1.7.1 Pr-processamento dos dados ............................................. 14 1.7.2 Planejamentos experimentais .............................................. 16 1.7.2.1 Planejamento composto central ...................................... 16 1.7.2.2 Parmetro de Taguchi ................................................... 17
1.7.3 Anlise de Componentes Principais (PCA) .............................. 18 1.7.4 SIMCA .............................................................................. 20 1.7.5 Anlise discriminante linear (LDA) ........................................ 22 1.7.6 Seleo de variveis ........................................................... 23 1.7.7 Algoritmo das projees sucessivas (SPA) ............................. 23 1.7.8 SPA no contexto da classificao .......................................... 25 1.7.9 Quimiometria aplicada voltametria ..................................... 26
CAPTULO II OBJETIVOS ............................................................. 32
2.1 Objetivo Geral ......................................................................... 33 2.1.1 Objetivos Especficos: ......................................................... 33
iii
CAPTULO III EXPERIMENTAL ..................................................... 34
3.1 Amostras ................................................................................ 35
3.2 Diviso do conjunto de amostras ............................................... 35
3.3 Materiais e reagentes ............................................................... 36
3.4 Equipamentos ......................................................................... 36
3.5 Procedimento analtico ............................................................. 37 3.5.1 Manipulao das amostras .................................................. 38 3.5.2 Eletrlito suporte, eletrodo de trabalho e sentido da varredura 39 3.5.3 Limpeza do eletrodo de trabalho e parmetros da SWV ........... 39
3.6 Softwares ............................................................................... 42
CAPTULO IV RESULTADOS E DISCUSSO ................................... 43
4.1 Eficincia da extrao alcolica ................................................. 44
4.2 Eletrlito suporte, eletrodo de trabalho e sentido da varredura ...... 45
4.3 Limpeza eletroqumica do eletrodo de trabalho ............................ 46
4.4 Otimizao dos parmetros da SWV ........................................... 49
4.5 Seleo da regio de trabalho no voltamograma ......................... 51
4.6 Perfis dos voltamogramas do etanol e de etanol + leo ................ 52
4.7 Pr-processamento dos voltamogramas ..................................... 53 4.7.1 Pr-processamento aplicado s variveis ............................... 54
4.8 Anlise exploratria dos dados .................................................. 55 4.8.1 Aplicao da PCA................................................................ 55 4.8.1.1 Aplicao da PCA s amostras no vencidas ..................... 56 4.8.1.2 Comparao dos leos em relao composio qumica ... 57 4.8.1.3 Aplicao de PCA s amostras da classe PVE .................... 59
4.9 Modelagem e Classificao SWV-SIMCA...................................... 60 4.9.1 Construo dos modelos SWV-SIMCA ................................... 61 4.9.2 Validao dos modelos SWV-SIMCA ...................................... 64 4.9.2.1 Validao do modelo SWV-SIMCA da classe Canola ........... 64 4.9.2.2 Validao do modelo SWV-SIMCA da classe Girassol ......... 67 4.9.2.3 Validao do modelo SWV-SIMCA da classe Milho ............. 67 4.9.2.4 Validao do modelo SWV-SIMCA da classe Soja .............. 68 4.9.2.5 Validao do modelo SWV-SIMCA da classe PVE ............... 69
4.9.3 Uso dos modelos SWV-SIMCA para o Conjunto de Previso ..... 72
4.10 Construo dos modelos SWV-LDA-SPA .................................... 74
iv
4.10.1 Uso do modelo SWV-LDA-SPA no Conjunto de Previso ......... 76 4.10.2 Uso do SWV-LDA-SPA para a previso de todas as amostras . 76
4.11 Comparao entre os modelos SWV-SIMCA e SWV-LDA-SPA ....... 78
CAPTULO V CONCLUSES ........................................................... 80
5.1 Concluses ............................................................................. 81
5.2 Propostas futuras .................................................................... 82
CAPTULO VI REFERNCIAS ........................................................ 83
v
NDICE DE FIGURAS
Figura 1.1 Estrutura molecular dos principais cidos graxos dos leos
vegetais .......................................................................................... 4
Figura 1.2 Variao de potencial em funo do tempo para a SWV.
Esto representados o potencial inicial, Ei, a amplitude de pulso, EP, o
incremento de potencial, ES, a largura de pulso, tP e os pontos A e B
onde as correntes direta e reversa so medidas, respectivamente. ........ 12
Figura 1.3 Voltamogramas esquemticos de onda quadrada (SOUZA
et al., 2003) para um processo redox de um sistema reversvel (1) e
de um sistema irreversvel (2). ......................................................... 12
Figura 1.4 Representao de uma matriz de dados de natureza
multivariada. .................................................................................. 14
Figura 1.5 Primeira e segunda PCs no espao tridimensional das
variveis. ....................................................................................... 19
Figura 1.6 Previso de uma amostra desconhecida A usando o modelo
SIMCA da classe B construdo com uma PC. A distncia y entre a
amostra A e o eixo da componente corresponde ao resduo da PC1, x
a distncia entre a projeo de A na direo da PC1 e a fronteira da
classe e z a distncia de A at o limite da classe. ........................... 20
Figura 1.7 Grfico de Si x Hi, detalhando os limites de uma
determinada classe 1 e a disposio das demais amostras ao seu
redor. Neste caso, uma das amostras da prpria classe 1 foi mal
classificada como visualizado. ........................................................... 21
Figura 1.8 Representao esquemtica da anlise discriminante
linear. Os centros de gravidade (os asteriscos) dos grupos formados
por crculos e quadrados so inicialmente determinados. Em seguida
traa-se um plano de deciso eqidistante e perpendicular linha que
une os centros de gravidade dos grupos, formando as regies R1 e R2.
vi
Se um ponto qualquer estiver presente na regio R1, o mesmo
classificado como pertencente ao grupo 1. Caso contrrio,
obrigatoriamente pertencer categoria 2.......................................... 22
Figura 1.9 Exemplo do funcionamento do SPA para selecionar
potenciais a partir de cinco variveis voltamtricas: a) Projees no
plano ortogonal a X3; b) Viso espacial dos vetores no plano
horizontal. ...................................................................................... 24
Figura 3.1 Potenciostato/Galvanostato AUTOLAB Type II
esquerda e o mdulo 663 VA Stand da cela eletroqumica direita. ..... 37
Figura 3.2 Esquema da extrao de cidos graxos das amostras de
leo e tomada de alquota para realizao das medidas. ....................... 38
Figura 3.3 Quadrado do voltamograma mdio (a) e perfil da varincia
(b). ................................................................................................ 41
Figura 4.1 Perfil dos voltamogramas aps a subtrao do perfil de
etanol P.A. no sentido de varredura andico para 4 diferentes
propores de uma amostra de leo de soja em etanol. ....................... 44
Figura 4.2 Perfil dos voltamogramas aps a subtrao do perfil de
etanol P. A. nos sentidos de varredura andica (linha preta) e catdico
(linha vermelha), empregando RDE-Au e o eletrlito suporte NaOH (a)
e o CH3COOH (b); RDE-Pt e o eletrlito suporte NaOH (c) e CH3COOH
(d). A concentrao dos eletrlitos de suporte foi 0,1 mol L-1. ............... 45
Figura 4.3 Voltamograma de uma amostra de leo de canola (linha
vermelha), na regio de 0,300 a -0,900 V, aps subtrair a resposta do
branco (NaOH 0,1 mol L-1 linha azul) do voltamograma
originalmente obtido pela SWV (linha verde). ...................................... 51
Figura 4.4 Voltamograma de uma amostra de leo de canola na
regio de trabalho selecionada (-0,046 a -0,900 V). ............................ 52
vii
Figura 4.5 Perfis, aps subtrao do branco, dos voltamogramas do
etanol (linha azul), de um leo de canola em etanol na proporo 1:1
(linha vermelha) e a subtrao destes dois perfis (linha verde). O
detalhe no canto superior esquerdo dessa figura uma ampliao da
rea marcada nos voltamogramas. .................................................... 52
Figura 4.6 Voltamogramas das 114 amostras de leo vegetal na
regio de trabalho, aps a subtrao do branco: Voltamogramas das
66 amostras de leo no vencidas (a) e das 48 amostras vencidas (b). .. 54
Figura 4.7 Grfico dos escores de PC1 versus PC2 das 114 amostras
de leo vegetal. .............................................................................. 55
Figura 4.8 Grfico dos escores de PC1 versus PC2 para as 66
amostras no vencidas de leo vegetal distribudas em quatro classes. .. 56
Figura 4.9 Voltamogramas mdios das classes Canola, Girassol, Milho
e Soja. A seta indica uma ampliao da regio de menor intensidade
de corrente e o crculo destaca a regio de -580 mV a -650 mV onde o
perfil da classe Canola se diferencia das demais. ................................. 57
Figura 4.10 Grfico dos escores de PC1 versus PC2 das 48 amostras
de leo vegetal da classe PVE. .......................................................... 59
Figura 4.11 Perfil voltamtrico das amostras de leo da classe PVE. ..... 60
Figura 4.12 Grficos da varincia residual e explicada versus n de
PCs das classes: a) Canola; b) Girassol; c) Milho; d) Soja; e) PVE. ........ 61
Figura 4.13 Grfico dos escores de PC1 versus PC2 versus PC3 para
as classes: a) Canola; b) Girassol; c) Milho; d) Soja; e) PVE. As
amostras dos conjuntos de treinamento e de teste esto pintadas de
azul e vermelho, respectivamente. .................................................... 63
Figura 4.14 Grfico de Si x Hi (95% de confiana) do modelo da
classe Canola construdo com 6 PCs. A seta indica uma ampliao das
viii
fronteiras deste modelo evidenciando a classificao incorreta da
amostra 11. .................................................................................... 65
Figura 4.15 Teste F aplicado aos resduos das amostras de
treinamento e teste da classe Canola para modelos com 4 (a), 5(b) e 6
(c) PCs. .......................................................................................... 65
Figura 4.16 Grfico de Si x Hi (95% de confiana) do modelo da
classe Canola construdo com 4 PCs aps a etapa de validao. A seta
indica uma ampliao das fronteiras deste modelo evidenciando a
classificao correta de todas as amostras. ......................................... 66
Figura 4.17 Grfico de Si x Hi (95% de confiana) do modelo da
classe Girassol construdo com 4 PCs. A seta indica uma ampliao das
fronteiras deste modelo evidenciando a classificao incorreta de sete
amostras de leo de soja. ................................................................. 67
Figura 4.18 Grfico de Si x Hi (95% de confiana) do modelo da
classe Milho construdo com 3 PCs. A seta indica uma ampliao das
fronteiras deste modelo evidenciando a classificao incorreta de uma
amostra de leo de soja. .................................................................. 68
Figura 4.19 Grfico de Si x Hi (95% de confiana) do modelo da
classe Soja construdo com 4 PCs. A seta indica uma ampliao das
fronteiras deste modelo evidenciando a classificao incorreta de seis
amostras de leo de girassol e de uma amostra de leo de milho. ......... 69
Figura 4.20 Grfico de Si x Hi (95% de confiana) do modelo da
classe PVE construdo com 3 PCs. A seta indica uma ampliao das
fronteiras do modelo evidenciando a classificao incorreta das
amostras 10 e 19. ........................................................................... 70
Figura 4.21 Teste F aplicado aos resduos das amostras de
treinamento e teste da classe PVE para modelos com 1 (a), 2(b), 3 (c)
e 4 (d) PCs. .................................................................................... 70
ix
Figura 4.22 Perfil dos resduos das amostras da classe PVE versus
variveis para modelos com 2 (a) e 4 (b) PCs. .................................... 71
Figura 4.23 Nmero de variveis selecionadas pelo SPA versus os
valores da funo de custo. .............................................................. 75
Figura 4.24 Variveis selecionadas pelo LDA-SPA. .............................. 76
Figura 4.25 Grfico dos escores de FD1 versus FD2 das 114 amostras
de leo vegetal. .............................................................................. 77
Figura 4.26 Grfico dos escores de FD2 versus FD3 para as 66
amostras no vencidas de leo vegetal distribudas em quatro classes. .. 78
x
NDICE DE TABELAS
Tabela 1.1 Principais oleaginosas e seus respectivos contedos em
leo. ............................................................................................... 6
Tabela 1.2 Caractersticas fsico-qumicas e composio em cidos
graxos dos leos refinados de canola, girassol, milho e soja (Fonte:
ANVISA, 2007). ................................................................................ 9
Tabela 3.1 Classes e quantidade de amostras de leos vegetais
analisados. ..................................................................................... 35
Tabela 3.2 Nmero de amostras de treinamento, teste e previso
selecionadas pelo KS para as cinco classes de leos vegetais. ............... 36
Tabela 4.1 Detalhamento dos fatores e nveis utilizados para a
construo do planejamento composto central, em que = 1,5. ........... 47
Tabela 4.2 Planejamento composto central 24 para a otimizao da
etapa de limpeza eletroqumica do eletrodo de trabalho. ...................... 48
Tabela 4.3 Parmetros timos escolhidos para a limpeza
eletroqumica do eletrodo. ................................................................ 49
Tabela 4.4 Detalhamento dos fatores e nveis utilizados para a
construo do planejamento composto central 23, em que = 1,67. ......... 49
Tabela 4.5 Planejamento composto central 23. ................................... 50
Tabela 4.6 Parmetros escolhidos para a SWV. .................................. 50
Tabela 4.7 Matriz da composio qumica dos leos vegetais de
acordo com os dados da RDC 492/99 (ANVISA, 2007). ........................ 58
Tabela 4.8 Correlao entre os diferentes tipos de leo vegetal de
acordo com a composio de qumica................................................. 58
xi
Tabela 4.9 Nmero de PCs e a varincia explicada acumulada dos
modelos SWV-SIMCA. ...................................................................... 62
Tabela 4.10 Nmero de PCs e varincia explicada acumulada para
cada modelo SWV-SIMCA de leo vegetal aps a etapa de validao. .... 72
Tabela 4.11 Classificao SIMCA das amostras de previso das cinco
classes de leo vegetal. O smbolo indica que a amostra foi
classificada no modelo. .................................................................... 73
Tabela 4.12 Erro de classificao dos modelos SWV-SIMCA (com
quatro nveis de significncia) e SWV-LDA-SPA para as amostras de
leo do conjunto de previso. ........................................................... 79
xii
LISTA DE ABREVIATURAS E SIGLAS
AcG cido Graxo
AcGs cidos Graxos
Ag/AgCl Eletrodo de referncia de prata/cloreto de prata
ALS Mnimos quadrados alternados
ANN Redes neurais artificiais
ANVISA Agncia Nacional de Vigilncia Sanitria
CLS Mnimos quadrados clssicos
CNNPA Conselho Nacional de Normas e Padres para Alimentos
CO2 Dixido de Carbono
CV Voltametria cclica
CVA Anlise de variveis cannicas
DA Anlise de Discriminante
DI Dimensionalidade inerente
DPP Polarografia de pulso diferencial
DPV Voltametria de pulso diferencial
f Freqncia da onda quadrada
FA Fase alcolica
Fcal Valor calculado para o teste F
Fcrit Valor crtico adotado para o teste F
FT Transformada de Fourier
G Risco mdio de uma classificao incorreta
HCA Anlise de agrupamentos hierrquicos
Hi Influncia
HMDE Eletrodo de gota pendente de mercrio
k Nmero de fatores no planejamento experimental
KF Kalman filter
KNN k-vizinhos mais prximos (k-nearest neighbours)
LDA Anlise discriminante linear
LDL Lipoprotena de baixa densidade (mau colesterol)
xiii
LSV Voltametria de varredura linear
MCR Resoluo de curva multivariada
MIR Espectroscopia no infravermelho mdio
MLR Regresso linear mltipla
nF Nmero de experimentos de um planejamento fatorial
NaOH Hidrxido de sdio
NIR Espectroscopia no infravermelho prximo
NPV Voltametria de pulso normal
PC Componente principal
PCA Anlise de componentes principais
PCR Regresso por componente principal
PLS Mnimos quadrados parciais
PVE Prazo de Validade Expirado
RDC Resoluo da Diretoria Colegiada
RDE-Pt Eletrodo rotatrio de disco de platina
RMSEP Erro quadrtico mdio de previso
Si Raiz quadrada da varincia residual
SIMCA Modelagem Independente Flexvel por Analogia de Classe
SPA Algoritmo das projees sucessivas
SWV Voltametria de onda quadrada
tP Largura ou tempo do pulso na onda quadrada
v Velocidade de varredura da onda quadrada
WT Transformada Wavelet
Xcal Matriz das amostras de calibrao
x Distncia entre a projeo de A na direo da PC e a fronteira
y Distncia entre a amostra desconhecida A e o eixo da PC
z Proximidade de A at a caixa
Z Parmetro de Taguchi
Valor da distncia axial dos pontos no planejamento estrela
EP Amplitude de pulso
ES Incremento de potencial
xiv
RESUMO
A autenticidade de leos vegetais comestveis tem se tornado um assunto
muito importante, tanto do ponto de vista comercial, devido evaso
fiscal, como do prejuzo sade do consumidor. Assim, necessrio o
desenvolvimento de novas metodologias analticas que possibilitem
anlises simples, rpida e de baixo custo. A combinao de mtodos
voltamtricos e quimiomtricos uma boa alternativa para atingir este
objetivo. A quimiometria tem sido muito usada em dados espectroscpicos
para uma variedade de aplicaes no campo de alimentos, medicamentos,
ambiental, etc. Todavia, poucos trabalhos tm explorado as caractersticas
atrativas dos mtodos voltamtricos, principalmente com relao sua
natureza multivariada associada quimiometria. Neste trabalho
proposto um mtodo rpido, simples e barato para fiscalizao de leos
vegetais comestveis que combina a voltametria de onda quadrada com
anlise discriminante linear associada ao algoritmo das projees
sucessivas para a seleo de variveis. Sua eficincia foi avaliada
comparando-o ao mtodo conhecido tradicionalmente como SIMCA. Cinco
classes de leo: Canola, Girassol, Milho, Soja e os com prazo de validade
expirado (PVE) de diferentes fabricantes foram analisadas, utilizando um
eletrodo de disco de platina. Para as 32 amostras do conjunto de previso,
o SIMCA apresentou 6 erros de classificao (81% de classificao
correta), enquanto que o mtodo proposto classificou corretamente todas
as amostras sendo, portanto, uma alternativa promissora para a
classificao de leos vegetais e a fiscalizao quanto ao prazo de
validade.
Palavras chave: leos vegetais, voltametria de onda quadrada, anlise
descriminante linear, algoritmo das projees sucessivas.
xv
ABSTRACT
The authenticity of edible vegetable oils has become a very important
issue, both in trade due to tax evasion, and the damage caused to the
health of the consumer. Thus, it is necessary to develop new analytical
methodologies that allow simple, fast and low cost analysis. The
combination of voltammetric and chemometric methods is a good
alternative to achieve this goal. Chemometrics has been widely used in
spectroscopic data for a variety of applications in the food, medicine, and
environmental areas, etc. However, few studies have investigated the
attractive characteristics of the voltammetric methods, particularly with
respect to its multivariate nature, with chemometrics. This work proposes
a fast, simple and cheap monitoring method for edible vegetable oils that
combines the Square Wave Voltammetry (SWV) with Linear Discriminant
Analysis (LDA) associated with Successive Projection Algorithm (SPA)
employed in the variable selection. Its performance was evaluated by
comparing it to the traditional method known as SIMCA (Soft Independent
Modeling of Class Analogy). Five classes of oil: canola, sunflower, corn,
soybean and the ones with expired shelf-life, from different manufacturers
were analyzed with a platinum disk working electrode. The SWV-SIMCA
method presented 6 errors (81% of correct classification), whereas the
SWV-LDA-SPA method proposed classified correctly all the prediction
samples, showing to be a promising alternative for classification and
inspection of vegetable oils.
Key words: vegetable oil, SWV, LDA, SPA, SIMCA.
CAPTULO I INTRODUO
2 INTRODUO
1.1 leos Vegetais
leos e gorduras so substncias lipoflicas bastante utilizadas pelos
organismos vivos, podendo ser de origem animal, vegetal ou mesmo
bacteriana (MORETTO e FEET, 1998) e formam uma das trs maiores
classes de produtos alimentcios, sendo as outras constitudas por
protenas e carboidratos, e so conhecidos desde os ancestrais do homem
pela facilidade de extrao e pelas diversas fontes e propriedades (WEISS,
1970). A diferena entre leos e gorduras definida pela resoluo n
20/77 do CNNPA (Conselho Nacional de Normas e Padres para
Alimentos) que impe a temperatura de 20 C como limite inferior para o
ponto de fuso das gorduras, ou seja, quando o ponto de fuso se situa
abaixo deste limite, a substncia classificada como leo (lquido a
temperatura ambiente). Contudo, o termo gordura o mais empregado
quando o estado fsico no significante.
O leo vegetal uma gordura obtida de plantas. extrado na
maioria das vezes das sementes ou gros destes vegetais conhecidos
como oleaginosos. Os leos destinados ao consumo humano so
submetidos a um processo de refino cuja finalidade melhorar sua
aparncia, sabor, odor e estabilidade por remoo de alguns componentes
como: cidos graxos livres, protenas, corantes naturais, umidade e
compostos volteis e inorgnicos (MORETTO e FEET, 1998).
A cadeia agroindustrial de oleaginosas abrange um conjunto de
mercados, dos quais os mais importantes so: produo e comrcio de
gros; produo de leos vegetais (leo bruto e refinado) e produo de
raes (COUTINHO et al., 2008). No Brasil, desde 1972 feito um
levantamento anual sobre a safra de gros. No ano de 2003 foi observada
uma produo de 123,6 milhes de toneladas, recorde nacional at ento.
No ano de 2007 um novo recorde foi atingido com uma produo de 133
milhes de toneladas, com soja e milho correspondendo a 82% do total.
Isto ocorreu devido ao elevado preo dos gros no mercado internacional,
fazendo do Brasil um dos maiores produtores mundiais de soja
3 INTRODUO
(BECKSTEIN, 2008). Para 2008, est previsto um aumento de 2,1% na
safra rendendo 135,7 milhes de toneladas. A crescente demanda das
oleaginosas responsvel direto pelo ascendente cultivo de gros (IBGE,
2008).
Alm do setor alimentcio, o Governo Federal brasileiro vem
incentivando o aproveitamento dos leos vegetais como fonte energtica
destinada a diversos segmentos, abrindo oportunidades nos setores social,
econmico e, sobretudo, ambiental. A produo est sendo destinada para
a estruturao do programa de produo e uso do biodiesel em muitos
pases, principalmente no Brasil, j que diversas espcies oleaginosas, tais
como a palma, nabo forrageiro, mamona, soja, girassol e babau, entre
outras so cultivadas e posteriormente utilizadas como matria-prima na
produo de biocombustvel (COUTINHO et al., 2008, BIODIESELBR,
2008).
Com base na expanso do mercado de leos vegetais, seu controle
de qualidade tem se tornado um assunto importante tanto do ponto de
vista comercial como da sade dos consumidores. Portanto, de
fundamental importncia o constante aperfeioamento de tcnicas
analticas simples, rpidas, robustas e de baixo custo.
1.2 Composio dos leos vegetais
Os leos vegetais so constitudos majoritariamente por
triglicerdeos, que so compostos de trs molculas de cido graxo (AcG)
com uma molcula de glicerol. As unidades acilas so os principais
constituintes dos leos vegetais, representando cerca de 95% da massa
molecular dos triglicerdeos. Em pequena quantidade aparecem mono e
diglicerdeos, cidos graxos livres, glicolipdeos, protenas, fosfolipdeos,
esteris entre outras substncias (MORETTO e FEET, 1998, WEISS, 1970,
KRAUSE e MAHAN, 1991).
Os AcGs so cidos monocarboxlicos de cadeia longa e com nmero
par de tomos de carbono (4 a 30 tomos) dispostos em uma cadeia
4 INTRODUO
linear, em virtude da sua produo biolgica, que se inicia a partir de
unidades acetato da acetil coenzima A. Podem ser saturados ou
insaturados, com estes predominando nos leos vegetais. As ligaes
duplas raramente se apresentam conjugadas (-CH=C=CH-), e sim,
separadas por um grupo metilnico (-CH=CH-CH2-CH=CH-). As duplas
ligaes impedem a rotao livre dos tomos gerando os ismeros nas
configuraes cis, que a mais comum entre os AcGs dos leos vegetais,
e trans. AcGs so geralmente representados pelo smbolo Cx:y(z), em que
Cx indica o nmero de tomos de carbono que forma a cadeia linear; y e z
indicam a quantidade de ligao dupla existente na molcula e sua(s)
posio(es), respectivamente. (MORETTO e FEET, 1998, WEISS, 1970,
KRAUSE e MAHAN, 1991).
Nos leos vegetais, os AcGs mais comuns so o palmtico (C16:0) e
o esterico (C18:0), entre os saturados, e olico (C18:1(9)), linolico
(C18:2(9,12)) e linolnico (C18:3(9,12,15)), entre os insaturados (Figura
1.1).
C
O
OH
C
O
OH
C
O
OH
C
O
OH
cido PalmtidoC16:0
cido EstericoC18:0
cido OlicoC18:1(9)
cido LinolicoC18:2(9,12)
C
O
OH
cido LinolnicoC18:3(9,12,15)
Figura 1.1 Estrutura molecular dos principais cidos graxos dos leos vegetais
Nas reas de bioqumica e nutrio, os cidos graxos so agrupados
em famlias conhecidas como mega (). Nestas, o carbono do
grupamento metila terminal reconhecido como posio nmero um,
logo, a posio da primeira ligao dupla caracteriza a famlia. Por
exemplo, o cido olico e o linolico pertencem s famlias 9 e 6,
5 INTRODUO
respectivamente (Figura 1.1). Os AcGs das famlias 6 e 3 no so
produzidos pelo organismo humano e por isso so considerados como
cidos graxos essenciais ao homem, sendo o cido linolico, 6, e o cido
linolnico, 3, os mais importantes (MORETTO e FEET, 1998, KRAUSE e
MAHAN, 1991). Todavia, o cido linolnico encontrado em baixas
concentraes na maioria dos leos vegetais, sendo o leo de linhaa uma
exceo com cerca de 60% (m/m) de 3 (CEOTTO, 2008).
1.3 leos vegetais e a sade humana
Os leos, juntamente com as gorduras, so denominados
geralmente de lipdios e so encontrados no sangue e em diferentes
rgos do homem. Eles desempenham funes cruciais como co-fatores
enzimticos, transportadores de eltrons, pigmentos que absorvem
radiaes luminosas, ncoras hidrofbicas, agentes emulsificantes,
hormnios, mensageiros intracelulares, componentes da estrutura celular
e como reservas de energia (LEHNINGER et al., 1995, KRAUSE e MAHAN,
1991). Esta importante fonte de combustvel para os seres humanos
contribui, em alguns pases, com 30-40% do total de energia consumida
na alimentao. Entretanto, quando ingeridos em excesso e/ou sem levar
em considerao a qualidade e o tipo da gordura, podem causar graves
problemas como a obesidade, o aumento de colesterol no sangue e
cardiopatias. Estas complicaes so atribudas maior proporo de
cidos graxos saturados que aparecem principalmente em gorduras
animais, manteigas e em produtos derivados da hidrogenao de leos
como as margarinas. Por outro lado, as gorduras insaturadas so capazes
de reduzir o ndice de colesterol, diminuindo os problemas
cardiovasculares. Como os leos vegetais so ricos em cidos graxos
insaturados, eles so os mais indicados para uma dieta saudvel
(MORETTO e FEET, 1998, KRAUSE e MAHAN, 1991).
Os cidos graxos linolico (6) e linolnico (3), ambos
poliinsaturados, fazem parte de um grupo especial de cidos graxos, cuja
6 INTRODUO
ingesto muito importante, pois ajudam na reduo dos nveis de
colesterol no sangue e desempenham funes fisiolgicas imprescindveis
nos organismos vivos, sendo, portanto, essenciais vida (LEHNINGER et
al., 1995, KRAUSE e MAHAN, 1991).
1.4 Tipos de leos vegetais
Existe uma grande diversidade de oleaginosas em todo o mundo.
Algumas das mais importantes esto listadas na Tabela 1.1.
Tabela 1.1 Principais oleaginosas e seus respectivos contedos em leo.
Material oleaginoso leo (% em massa)
Copra 66-68
Babau 60-65
Gergelim 50-55
Polpa de palma (dend) 45-50
Caroo de palma 45-50
Amendoim 45-50
Colza (canola) 40-45
Girassol 35-45
Aafro 30-35
Oliva 25-30
Algodo 18-20
Soja 18-20
De acordo com a Agncia Nacional de Vigilncia Sanitria, em sua
resoluo RDC 482/99 (ANVISA, 2007), so comercializados no Brasil os
seguintes leos vegetais:
algodo milho palma amendoim soja palmiste arroz uva oliva canola babau gergelim girassol cco azeite saborizado
A seguir, so apresentadas caractersticas de quatro destes leos, a
saber, canola, girassol, milho e soja.
1.4.1 leo de canola
Este leo conhecido desde os primeiros sculos da Era Crist como
produto de extrao de uma planta chamada colza. No entanto, ela
7 INTRODUO
comeou a participar da alimentao humana somente a partir da dcada
de 1970, quando cientistas conseguiram, atravs de melhoramento
gentico, desenvolver espcies dessa planta (Brassica nabus e Brassica
campestris) com teores aceitveis de cido ercico e glucosilonatos. O
nome canola (Canadian Oil Low Acid) foi oficialmente aceito pela
Canadian Grain Commission, em 1987 (MORETTO e FEET, 1998).
Atualmente a canola cultivada em diversos pases, sendo China,
Canad, ndia, Alemanha, Frana, Austrlia e Polnia os maiores
produtores mundiais (GAZZONI, 2007). No Brasil, os trabalhos de
pesquisa com a cultura de colza nos estados do Rio Grande do Sul e de
Santa Catarina foram iniciados em 1974, em meados dos anos 80 no
Paran (PR) e em 2003 no estado de Gois (GO). Os gros de canola
produzidos no pas possuem cerca de 24 a 27% de protena e de 34 a
40% de leo (EMBRAPA, 2007a).
O leo de canola um dos mais saudveis, pois possui elevada
quantidade de 3, gorduras monoinsaturadas e vitamina E, que ajudam a
diminuir o LDL (low density lipoprotein), mais conhecido como mau
colesterol. Alm disso, possui menor quantidade de gordura saturada
(6%) quando comparados com leos de soja (15%) e de milho (11%)
(MORETTO e FEET, 1998, EMBRAPA, 2007a, EMBRAPA, 2007b).
1.4.2 leo de girassol
O girassol (Helianthus annus L.) uma planta de origem americana,
que foi utilizada como alimento pelos ndios. um dos poucos vegetais
que pode ser cultivado em clima frio (ANVISA, 2007, WEISS, 1970).
Atualmente, os maiores produtores mundiais so a Rssia, Estados
Unidos, Argentina e China. O girassol ocupa o quarto lugar como fonte de
leo comestvel, perdendo para soja, palma e canola. A produo
brasileira ainda pouco expressiva, mas o pas tem importado este gro,
principalmente da Argentina, para atender a demanda comercial deste
produto, uma vez que o leo de girassol vem sendo indicado em dietas
por sua baixa quantidade de cidos graxos saturados, alto teor de cido
8 INTRODUO
linolico e vitaminas, alm de apresentar caractersticas organolpticas
agradveis (ABOISSA, 2007, CAMPESTRE, 2006).
1.4.3 leo de milho
O milho (Zea mays L.) um dos cereais mais cultivados por todo o
mundo. Originou-se nas Amricas e logo foi difundido pela Europa, frica
e sia. Atualmente, os maiores produtores mundiais so os Estados
Unidos, entretanto, outros pases como Canad, China, Pases Blticos,
Brasil, Mxico, Argentina e frica do Sul tm uma produo significativa
deste gro. No Brasil, o milho o cereal mais cultivado depois da soja
(MORETTO e FEET, 1998, IBGE, 2008).
Os principais cidos graxos que compem o leo de milho so o
linolico (at 62%) e olico (at 42%). O cido linolnico (tri-insaturado)
altamente sujeito oxidao e est presente em pequena percentagem
neste leo, quando comparado ao de soja. Geralmente, os triglicerdeos
do leo de milho apresentam a cadeia poliinsaturada na posio central do
glicerol (carbono 2), cercada por duas cadeias saturadas, ou por uma
cadeia saturada e uma insaturada nas extremidades (carbono 1 e 3). Esta
configurao fornece cadeia poliinsaturada uma proteo contra os
processos oxidativos, aumentando a estabilidade, j que as posies 1 e 3
so a mais reativas (MORETTO e FEET, 1998, RODRIGUES et al., 2003,
REGINA e SOLFERINI, 2007).
1.4.4 leo de soja
A soja (Glycine max L.) a oleaginosa mais cultivada no Brasil, que
ocupa a 2 posio do ranking mundial da produo, perdendo apenas
para os Estados Unidos (IBGE, 2008, GAZZONI, 2007). Esta oleaginosa
domina o mercado mundial tanto de protena vegetal como de leo
comestvel (MORETTO e FEET, 1998). O gro de soja possui cerca de 40%
de protenas, 20% de lipdios (leo), 5% de minerais e 34% de
carboidratos, alm de minerais como potssio, clcio, fsforo, ferro,
cobre, magnsio e sdio. Os principais AcGs que compem o leo de soja
9 INTRODUO
so o linolico, olico, palmtico e linolnico. Estas caractersticas fazem
da soja e seus derivados um importante fator para a balana comercial
brasileira. A vantagem do leo de soja em relao a outros se deve ao seu
baixo preo aliado sua boa qualidade. No Brasil, alm de ser utilizado na
alimentao e em diversos outros setores, o leo de soja vem se
destacando na produo de biodiesel, abrindo tambm as possibilidades
para a utilizao dos demais leos vegetais, uma vez que eles se
tornaram o principal insumo para a produo de biodiesel (EMBRAPA,
2007c, CAMPESTRE, 2007).
A Tabela 1.2 abaixo detalha as caractersticas fsico-qumicas e os
cidos graxos presentes nos leos refinados de canola, girassol, milho e
soja de acordo com a RDC 482/99 da ANVISA (2007).
Tabela 1.2 Caractersticas fsico-qumicas e composio em cidos graxos dos leos refinados de canola, girassol, milho e soja (Fonte: ANVISA, 2007).
Canola Girassol Milho Soja
Caractersticas
fsico-qumicas
ndice de Refrao (40C)
1,465-1,467 1,467-1,469 1,465-1,468 1,466-1,470
ndice de Iodo (Wijs) 110-126 110-143 103-128 120-143 ndice de Saponificao 182-193 188-194 187-195 189-195 Matria Insaponificvel (g/100g)
< 2,0 < 1,5 < 2,8 < 1,5
Acidez (g de cido olico/100g)
< 0,3 < 0,3 < 0,3 < 0,3
ndice de Perxido (meq/Kg) < 10,0 < 10,0 < 10,0 < 10,0
Brassicasterol (g/100g) > 5,0
cidos graxos (g/100g)
C < 14 < 0,4 < 0,3 < 0,1 Mirstico - C14:0 < 0,2 < 0,5 < 0,1 < 0,5 Palmtico - C16:0 2,5-6,5 3,0-10,0 9,0-14,0 7,0-14,0 Palmitolico - C16:1 < 0,6 < 1,0 < 0,5 < 0,5 Esterico - C18:0 0,8-3,0 1,0-10,0 0,5-4,0 1,4-5,5 Olico (9) - C18:1 53,0-70,0 14,0-35,0 24,0-42,0 19,0-30,0 Linolico (6) - C18:2 15,0-30,0 55,0-75,0 34,0-62,0 44,0-62,0 Linolnico (3) - C18:3 5,0-13,0 < 0,3 < 2,0 4,0-11,0 Araqudico - C20:0 0,1 - 1,2 < 1,5 < 1,0 < 1,0 Eicosenico - C20:1 0,1 - 4,3 < 0,5 < 0,5 < 1,0 Behnico - C22:0 < 0,6 < 1,0 < 0,5 < 0,5
Lignocrico - C24:0 < 0,2 < 0,5 < 0,5 Ercico- C22:1 < 2,0 < 0,5 Tetracosenico C24:1 < 0,2 < 0,5
10 INTRODUO
1.5 Controle de qualidade de leos vegetais
A comunidade cientfica mundial tem proposto diversos mtodos
para o controle de qualidade de leos vegetais. Critrios de qualidade
qumicos e fsico-qumicos tm sido determinados por espectrometria no
infravermelho prximo (Near Infrared NIR) e no mdio (Mid Infrared
MIR) (HENDL et al., 2001, FRANCO et al., 2006, BARTHUS e POPPI, 2001,
CHRISTY e EGEBERG, 2006, WANG et al., 2006, GUILLN e CABO, 1997).
Tambm so empregadas outras tcnicas como cromatografia (MALAVIA,
2007), fluorescncia (SIKORSKA et al., 2005, POULLI et al., 2005, POULLI
et al., 2006) e quimiluminescncia (STEPANYAN et al., 2005,
PAPADOPOULOS, 2002).
Mtodos quimiomtricos tm sido comumente aplicados a dados
cromatogrficos e espectroscpicos com a finalidade de comparao,
discriminao e classificao na avaliao da autenticidade de leos
vegetais. Neste contexto, as tcnicas estatsticas multivariadas mais
utilizadas so: k-vizinhos mais prximos (k-Nearest Neighbours KNN)
(SIKORSKA, 2005), anlises de discriminante (Discriminant Analysis
DA) (SIKORSKA et al., 2005, LANKMAYR et al., 2004, MARTN et al.,
1999, LAI et al., 1994, BAETEN et al., 1998, VONCINA et al., 2005, NAGY
et al., 2005, LEE et al., 2001, KEMSLEY, 1996), anlise de agrupamentos
hierrquicos (Hierarchical Cluster Analysis HCA) (POULLI et al., 2005),
anlise de componente principal (Principal Component Analysis PCA)
(POULLI et al., 2005, DIAZ et al., 2005, LEE et al., 1998, LANKMAYR et
al., 2004, LAI et al., 1994, LEE et al., 2001, KEMSLEY, 1996), modelagem
flexvel independente por analogia de classe (Soft Independent Modelling
of Class Analogy SIMCA) (DIAZ et al., 2005), anlise de variveis
cannicas (Canonical Variables Analysis CVA) (ALVES et al., 2005),
mnimos quadrados parciais (Partial Least Squares PLS) (CHRISTY et
al., 2004, MARQUEZ et al., 2005, KEMSLEY, 1996), redes neurais
artificiais (Artificial Neural Networks ANN) (VONCINA et al., 2005,
HUSAIN et al., 1996) e algoritmo das projees sucessivas (Successive
Projection Algorithm SPA) (PONTES et al., 2005).
11 INTRODUO
A maioria das tcnicas citadas acima possui como desvantagem o
alto custo dos equipamentos e manuteno, quando comparadas com a
voltametria de onda quadrada (Square Wave Voltammetry SWV) que
utiliza instrumentao simples e de custo relativamente baixo.
1.6 Voltametria de onda quadrada
A SWV foi criada na dcada de 1950 quando Barker aplicou pulsos
de potencial a um eletrodo gotejante de mercrio e chegou polarografia
de onda quadrada (BARD e FAULKNER, 2001, SOUZA et al., 2003).
Ramaley e Krause basearam-se nos trabalhos de Barker para
desenvolver a teoria da voltametria de onda quadrada utilizando eletrodos
estacionrios com o intuito de eliminar os rudos provenientes do capilar
de mercrio. A partir da, a SWV pde ser utilizada para a anlise de
traos com a vantagem da possibilidade de substituio do eletrodo de
mercrio por um eletrodo slido (RAMALEY e KRAUSE, 1969, KRAUSE e
RAMALEY, 1969). Nestes trabalhos, os autores se limitaram a saltos de
pequeno incremento de potencial, resultando em baixas velocidades de
varreduras.
As limitaes da metodologia desenvolvida por RAMALEY e KRAUSE
(1969) foram analisadas por CHRISTIE et al. (1977) e TURNER et al.
(1977), para ento, chegar ao modelo atual da SWV, em que as leituras
de correntes em funo dos pulsos de potenciais aplicados so feitas a
velocidades maiores.
A SWV consiste em aplicar, ao eletrodo de trabalho, dois pulsos de
potenciais simtricos sobre cada degrau de uma escada de potencial. Um
dos pulsos aplicado no sentido da escada de potencial (direto) e o outro,
no sentido reverso. A corrente medida no final de cada pulso, fechando
um ciclo de onda quadrada (SKOOG et al., 2002, WANG, 2006, BARD e
FAULKNER, 2001).
A Figura 1.2 ajuda a definir os principais parmetros da onda
quadrada, que se caracteriza por uma amplitude de pulso, EP, medida
12 INTRODUO
com relao a cada degrau da escada, e uma largura de pulso, tP, dada
em tempo e que tambm pode ser expressa em termos da freqncia da
onda quadrada, f = 1/2tP. A varredura comea num potencial inicial, Ei,
ento, no final de cada ciclo a escada aumenta instantaneamente por um
incremento de potencial, ES. Conseqentemente, a velocidade de
varredura, v = ES/2tP, pode ser dada por v = ES x f. O sinal obtido
como uma intensidade de corrente de forma diferencial entre as correntes
nos sentidos direto e reverso, apresentando excelente sensibilidade e alta
rejeio a correntes capacitivas (BARD e FAULKNER, 2001, SOUZA et
al.,2003, SOUZA et al., 2004).
Figura 1.2 Variao de potencial em funo do tempo para a SWV. Esto representados o potencial inicial, Ei, a amplitude de pulso, EP, o incremento de potencial, ES, a largura de pulso, tP e os pontos A e B onde as correntes direta e reversa so medidas, respectivamente.
O pico voltamtrico resultante apresenta posio, largura e altura
caractersticas do tipo de sistema redox (WANG, 2006, SOUZA et al.,
2004). A Figura 1.3 apresenta os voltamogramas tericos associados a um
sistema reversvel e irreversvel com a separao observada das correntes
direta, reversa e resultante.
Figura 1.3 Voltamogramas esquemticos de onda quadrada (SOUZA et al., 2003) para um processo redox de um sistema reversvel (1) e de um sistema irreversvel (2).
13 INTRODUO
A principal vantagem da SWV a possibilidade de se obter correntes
de pico bem definidas em experimentos executados em alta velocidade de
varredura, resultando em anlises mais rpidas e com alta sensibilidade.
Alm disso, por tratar-se de uma tcnica de pulso, a corrente faradaica
pode ser registrada no final do pulso, instante no qual a contribuio da
corrente capacitiva minimizada (BARD e FAULKNER, 2001).
A voltametria ganhou grande importncia na qumica analtica
medida que os equipamentos e as tcnicas foram se aperfeioando
(SKOOG et al., 2002). Entretanto, estas tcnicas ficaram limitadas,
principalmente, a aplicaes em calibrao univariada. Um perfil
voltamtrico apresentando vrias sobreposies de picos analticos que,
em geral, parece ser um grave problema, na verdade um excesso de
informaes valiosas muito prximas umas das outras, que podem ser
extremamente teis quando mtodos quimiomtricos so empregados
para extrair o mximo de informaes possveis (HERRERO e ORTIZ,
1999).
1.7 Quimiometria
O ascendente avano tecnolgico faz com que a qumica, sobretudo
a qumica analtica moderna, ocupe um lugar de destaque na Cincia.
Atualmente, existem diversas tcnicas analticas que podem gerar grande
quantidade de dados em curto intervalo de tempo. Estes dados
apresentam uma gama de informao de natureza multivariada e, muitas
vezes, complexa, o que torna importante o uso de ferramentas que
permitam extrair, de um modo mais criterioso, o maior nmero possvel
de informaes relevantes. Neste contexto, torna-se extremamente til o
uso da Quimiometria (MASSART et al., 1997, KOWALSKI, 1984, BEEBE et
al., 1998), que pode ser definida como um conjunto de mtodos
matemticos e/ou estatsticos utilizados para planejar ou selecionar
experimentos de forma otimizada e extrair o mximo de informao
qumica dos dados obtidos (FERREIRA et al., 1999).
14 INTRODUO
A quimiometria agrupa vrias ferramentas extremamente teis para
planejamento e otimizao de experimentos (PIMENTEL et al., 1998,
HONORATO et al., 2002), processamento de sinais (GALVO et al., 2004,
GALVO et al. 2001a), seleo de variveis e amostras (PONTES et al.,
2005, DANTAS-FILHO et al., 2004, ARAUJO et al., 2001, GALVO et al.,
2001b), reconhecimento de padres e classificao de amostras (PONTES
et al., 2005, COSTA et al., 2004), calibrao multivariada (DANTAS-FILHO
et al., 2004, ARAUJO et al., 2001, GALVO et al., 2001b), transferncia de
calibrao (HONORATO et al., 2005), entre outros.
Uma Tabela, representada por uma matriz Amxn (Figura 1.4)
utilizada para apresentar os dados de natureza multivariada. Nela,
geralmente as amostras (objetos) esto localizadas nas linhas e as
variveis, que so medidas de alguma propriedade das amostras, so
distribudas nas colunas. No caso de dados voltamtricos, as variveis so
os valores de corrente registrados em cada potencial que compe a janela
de varredura.
Figura 1.4 Representao de uma matriz de dados de natureza multivariada.
1.7.1 Pr-processamento dos dados
Os dados obtidos de uma anlise, tambm conhecidos como dados
brutos, podem apresentar diversas fontes de variao causando
irregularidades sistemticas na linha de base, rudos instrumentais ou
variveis de diferentes unidades e magnitudes. Ento, antes da realizao
da modelagem multivariada propriamente dita, faz-se necessrio um pr-
processamento para remover as fontes indesejveis de variaes que
possam atingir as variveis e/ou amostras do conjunto de dados como um
todo (MASSART et al., 1997, FERREIRA et al., 1999).
15 INTRODUO
Existem basicamente trs tipos de pr-processamento aplicveis s
variveis: a centralizao dos dados na mdia, que consiste na subtrao
dos elementos de cada linha pela mdia da sua respectiva coluna, o
escalonamento, onde cada elemento de uma linha dividido pelo desvio
padro da sua respectiva varivel, fazendo com que todos os eixos da
coordenada sejam conduzidos mesma escala e, conseqentemente,
cada varivel fica com o mesmo peso, e o auto-escalonamento, que
consiste em centralizar os dados na mdia e efetuar o escalonamento.
Desta forma, as variveis tero mdias zero e desvios padres igual a um.
Tanto o escalonamento quanto o auto-escalonamento so utilizados
quando se pretende atribuir a mesma importncia s variveis do sistema
de investigao (MASSART et al., 1997, BEEBE et al., 1998).
Alm do pr-processamento dos dados aplicado s variveis,
devem-se considerar tambm as variaes existentes entre as amostras.
Para contornar tais problemas, mtodos como a normalizao, a
derivao, a filtragem de rudo aleatrio, entre outros so bastante
utilizados. A normalizao aplicada quando se deseja remover variaes
sistemticas presentes na amostra. Ela realizada dividindo cada varivel
por uma constante que escolhida a partir de uma anlise preliminar dos
dados. Os mtodos de derivao so comumente aplicados quando, em
um conjunto de dados, deseja-se corrigir problemas relacionados com a
variao da linha de base. Alm disso, o mtodo da derivao muito til
para permitir uma melhor visualizao de picos existentes nos sinais
originais. Contudo, uma avaliao prvia dos dados deve ser realizada,
pois as respostas instrumentais so compostas de sinais verdadeiros e
rudos aleatrios que podem aparecer com baixa ou alta intensidade.
Portanto, o mtodo derivativo pode, em muitos casos, super-dimensionar
a presena de eventuais rudos presentes nas amostras (MASSART et al.,
1997, BEEBE et al., 1998).
Vale salientar que, o uso de um ou outro mtodo de pr-
processamento, seja ele aplicado s amostras e/ou variveis, deve ser
previamente avaliado procurando sempre tomar as decises mais
16 INTRODUO
coerentes de acordo com a natureza dos dados. Para isto, muito
importante ter conhecimento aprofundado sobre o sistema em estudo.
1.7.2 Planejamentos experimentais
Diversas variveis influenciam a qualidade dos dados e resultados
obtidos por voltametria. Ainda assim, tcnicas quimiomtricas de
planejamento experimental tm sido pouco exploradas na otimizao
dessas variveis.
Planejamentos experimentais tpicos podem ser aplicados no
contexto da qumica eletroanaltica, s vezes, sendo necessrio um ou
mais planejamentos para atingir o objetivo final. Sempre que possvel, os
parmetros destas tcnicas como incremento de potencial e amplitude de
pulso, entre outros no caso da voltametria, devem ser avaliados de modo
a garantir que o mtodo seja sensvel, preciso e exato.
Por conveno, adotam-se as seguintes notaes para o uso de
planejamento experimental:
Fatores: so as variveis controladas
Valor das variveis (Nveis): so valores dos fatores compreendendo a regio de
investigao.
Resposta do experimento: o valor, alvo da otimizao, obtido para cada
experimento.
1.7.2.1 Planejamento composto central
O planejamento composto central uma opo vantajosa ao
planejamento fatorial completo de trs ou mais nveis, por fornecer igual
ou menor nmero de experimentos. Em geral, um planejamento composto
central para k fatores formado por trs partes:
Um planejamento fatorial completo ou fracionrio de dois (2) nveis e k fatores,
contendo nF = 2k experimentos;
Um planejamento axial ou estrela, formado por 2k experimentos e com todos os
fatores nulos, exceto um, que igual a um certo valor ou -;
Um ponto central, que deve ser repetido determinado nmero de vezes.
17 INTRODUO
Desta forma, o total de experimentos distintos ser: nF + 2k + 1.
O valor da distncia axial dos pontos no planejamento estrela, ,
geralmente estabelecido usando-se o conceito de rotabilidade em que 2 . Um planejamento rodvel se a varincia de suas estimativas s depender da distncia em relao ao ponto central, ou seja, se a
preciso da resposta prevista for a mesma em todos os pontos situados
numa hiperesfera com centro no prprio centro do planejamento. Esta
propriedade esfrica um critrio de projeto usado quando o
planejamento fatorial completo. No entanto, no importante ter uma
rotabilidade exata para se ter um bom planejamento. (BARROS-NETO et
al., 2003, CALADO e MONTGOMERY, 2003).
1.7.2.2 Parmetro de Taguchi
Taguchi (MASSART et al., 1997) interessou-se pela problemtica de
como usar planejamento experimental para diminuir a disperso em
torno de um valor desejado e conseqentemente aumentar a robustez de
um produto. Sua idia consiste basicamente de dois elementos: 1)
resposta e 2) planejamento experimental que permite a maximizao da
resposta.
A resposta caracterizada pelo valor e sua disperso quando o
experimento replicado. Neste caso, o valor da resposta e a disperso
so dados pelas Equaes (1.1) e (1.2), respectivamente:
(1.1)
(1.2)
onde a mdia das respostas, chamada de sinal e a varincia, chamada de rudo. A proposta de Taguchi (Equao 1.3) foi maximizar a
relao sinal/rudo.
18 INTRODUO
10 10 10 10 log log log log (1.3) Isto equivalente a minimizar o desvio padro relativo, ou seja, melhorar
a preciso do mtodo utilizado.
Uma vez que um mtodo analtico otimizado atravs de
planejamentos estatisticamente bem estabelecidos, os sinais, por ele
obtidos, tornam-se mais adequados ao emprego de ferramentas
quimiomtricas para a construo de modelos de classificao e/ou
calibrao multivariada.
1.7.3 Anlise de Componentes Principais (PCA)
A PCA uma tcnica quimiomtrica de reconhecimento de padres
no-supervisionado cujo princpio fatorar um conjunto de dados de
natureza multivariada, objetivando a representao das variaes
existentes na forma de componentes principais (PCs) (Figura 1.5). As PCs
so as representaes dos novos eixos formados a partir da combinao
linear das variveis originais e nelas est contida toda a informao dos
dados na forma de varincia. Elas so sempre ortogonais
(perpendiculares) umas as outras, e sucessivas PCs descrevem
quantidades decrescentes da varincia explicada dos dados, de modo que
a informao relevante est contida nas primeiras componentes. Por esta
razo, poucas PCs so necessrias para que toda ou a maior parte da
varincia dos dados seja explicada, permitindo que os dados multivariados
sejam interpretados em dimensionalidades plausveis percepo humana
(MASSART et al., 1997, BEEBE et al., 1998, FERREIRA et. al., 1999).
19 INTRODUO
Figura 1.5 Primeira e segunda PCs no espao tridimensional das variveis.
A contribuio que cada varivel original exerce sobre uma
determinada PC denominada peso, que pode ser definido,
matematicamente, como sendo o cosseno do ngulo entre o eixo da
varivel e o eixo da PC. Da mesma forma que as amostras tm
coordenadas definidas pelas variveis originais, elas tambm as possuem
em relao aos novos eixos (PCs), onde so denominadas escores das
amostras. Um determinado nmero (menor do que o total) de PCs no
consegue descrever toda a varincia dos dados, ento essa parte no
descrita ser representada em uma nova matriz chamada de resduos
(MASSART et al., 1997, BEEBE et al., 1998).
O nmero de PCs suficiente para descrever a informao dos dados
definido como sendo a dimensionalidade inerente (DI) ou posto da
matriz. A DI deve-se s caractersticas fsicas e/ou qumicas encontradas
no conjunto de dados, que esto mascaradas pela presena de correlao
entre as variveis e rudos. Para que a DI seja alcanada, imprescindvel
definir o nmero adequado de PCs que fornecem as informaes de
interesse para o analista, excluindo o mximo de rudo sem comprometer
as informaes pertinentes melhor interpretao dos dados. Por isso,
recorre-se ao uso de ferramentas de diagnstico, que investigam e
exploram trs aspectos do conjunto de dados: o modelo, as amostras e as
variveis. Dentre estas ferramentas, pode-se citar o grfico dos resduos,
o grfico da varincia explicada, grfico dos escores e o grfico dos pesos.
20 INTRODUO
Outro ponto to importante quanto determinao do nmero de
PCs a deteco de amostras anmalas (outliers), que apresentam
caractersticas diferentes e afetam os resultados obtidos. Estas amostras
devem, portanto, ser removidas do conjunto de dados (MASSART et al.,
1997, BEEBE et al., 1998). importante ressaltar que o descarte de uma
ou mais amostras do modelo deve ser efetivamente avaliado utilizando
diversos tipos de ferramentas de diagnstico. Desconsiderar a
variabilidade existente do conjunto de dados como um todo e adotar, com
pouca informao a priori, uma amostra como sendo outlier pode
prejudicar o desempenho dos modelos.
PCA uma tcnica bastante utilizada como base para outras
tcnicas quimiomtricas multivariadas como, por exemplo, o SIMCA, que
uma tcnica de reconhecimento de padro supervisionado.
1.7.4 SIMCA
O SIMCA um mtodo de reconhecimento de padro supervisionado
no qual cada classe individualmente modelada por PCs (KOWALSKI,
1984). Para cada classe ou grupo de amostras previamente estabelecido,
um modelo PCA construdo delimitando estatisticamente uma regio
espacial. Amostras futuras podem ser avaliadas como pertencentes sua
classe verdadeira se possurem caractersticas que possam ser inseridas
no espao multidimensional de um dos agrupamentos (BEEBE et al.,
1998, FLATEN et al., 2004), ou seja, a amostra classificada como
pertencente a uma dada classe se apresentar varincia dentro de um
valor crtico determinado pelo modelo. Obtm-se este valor em funo do
valor de z2 (Figura 1.6) calculado pela Equao (1.4).
Figura 1.6 Previso de uma amostra desconhecida A usando o modelo SIMCA da classe B construdo com uma PC. A distncia y entre a amostra A e o eixo da componente corresponde ao resduo da PC1, x a distncia entre a projeo de A na direo da PC1 e a fronteira da classe e z a distncia de A at o limite da classe.
21 INTRODUO
z2 = x2 + y2 (1.4)
O valor z2 convertido a uma varincia e dividido pela varincia das
amostras da classe B para formar um valor F calculado, Fcal. Utiliza-se,
ento, o teste F, em que um valor crtico, Fcrit, escolhido empiricamente
ou a partir de uma tabela do teste F. Se o Fcal for menor do que o valor
crtico adotado, a amostra desconhecida pode ser classificada como
pertencente classe B (MASSART et al., 1997, BEEBE et al., 1998).
Uma das ferramentas utilizadas pelos pacotes quimiomtricos para
mostrar os resultados da classificao SIMCA uma tabela de asteriscos,
em que a presena dos mesmos representa que a amostra foi classificada
como pertencente ao modelo elaborado. Outra forma o grfico
bidimensional Si x Hi (Figura 1.7). Este grfico detalha os dois limites
usados para a classificao: a distncia da amostra em relao ao modelo
da classe selecionado (raiz quadrada da varincia residual, Si) e a
influncia (Leverage, Hi) que a distncia das amostras projetada ao
centro do modelo. Ento, amostras que se encontrarem dentro de ambos
os limites definidos pelo modelo especfico, pertencero classe em
questo (CAMO, 1998).
Figura 1.7 Grfico de Si x Hi, detalhando os limites de uma determinada classe 1 e a disposio das demais amostras ao seu redor. Neste caso, uma das amostras da prpria classe 1 foi mal classificada como visualizado.
22 INTRODUO
Dois tipos de erros podem ocorrer em um estudo de classificao:
Erro do Tipo I (Falso-Positivo): amostra avaliada no classificada em sua prpria
classe.
Erro do Tipo II (Falso-Negativo): amostra avaliada classificada em uma classe
errada.
Em SIMCA, a mesma amostra pode apresentar erros do Tipo I e do
Tipo II simultaneamente, quando deixar de classificar em sua classe
verdadeira e classificar em uma ou mais classes erradas.
1.7.5 Anlise discriminante linear (LDA)
A anlise discriminante linear (LDA) uma tcnica que consiste em
estimar uma combinao linear de duas ou mais variveis independentes
obtendo uma funo linear, que pode distinguir os pontos relativos aos
dados de dois ou mais grupos. Se essa funo de fato existe, ento
possvel dizer que os pontos pertencentes a esses grupos so linearmente
separveis. A discriminao feita determinando o conjunto timo de
pesos para as variveis independentes de tal maneira que se maximize a
varincia entre os grupos em relao varincia dentro dos grupos. Uma
das maneiras mais simples de se obter uma funo linear discriminante
(MASSART et al., 1997, KOWALSKI et al., 1984, BRUNS e FAIGLE, 1985)
ilustrada na Figura 1.8.
Figura 1.8 Representao esquemtica da anlise discriminante linear. Os centros de gravidade (os asteriscos) dos grupos formados por crculos e quadrados so inicialmente determinados. Em seguida traa-se um plano de deciso eqidistante e perpendicular linha que une os centros de gravidade dos grupos, formando as regies R1 e R2. Se um ponto qualquer estiver presente na regio R1, o mesmo classificado como pertencente ao grupo 1. Caso contrrio, obrigatoriamente pertencer categoria 2.
23 INTRODUO
Vale salientar que em LDA, se a amostra apresentar erro do Tipo I,
conseqentemente ocorrer erro do Tipo II (BRUNS e FAIGLE, 1985).
Diferentemente do SIMCA, mtodo de classificao consolidado para
trabalhar em altas dimenses, a LDA limita-se ao uso de dados com baixa
dimensionalidade. Neste contexto, torna-se necessrio o emprego de
mtodos de seleo de variveis que so teis para aumentar a
capacidade preditiva dos modelos, eliminar variveis no informativas e
reter aquelas que, provavelmente, resultam em uma boa exatido.
1.7.6 Seleo de variveis
As tcnicas quimiomtricas tradicionalmente utilizadas no contexto
da classificao possibilitam trabalhar com todo o conjunto de dados,
reduzindo sua dimensionalidade, por meio de fatorao, para facilitar a
visualizao e interpretao destes dados. Por exemplo, PCA transforma
as variveis e distribui os objetos em novos sistemas de eixos ortogonais
em funo da maior varincia dos dados (MASSART et al., 1997, BEEBE et
al., 1998), permitindo a utilizao destes com bastante eficincia em
tcnicas como SIMCA e LDA (DIAZ et al., 2005, PONTES et al., 2006,
KEMSLEY, 1996). A principal desvantagem deste tipo de compresso de
dados a dificuldade de interpretaes fsicas ou qumicas do sistema,
tendo em vista que trabalha no domnio das variveis transformadas.
Vrios algoritmos tm sido propostos para uma seleo mais conveniente
de variveis (GESTAL et al., 2004, WU e MASSART, 1997, STEEL et al.,
2000), entre eles, pode-se destacar o SPA desenvolvido por ARAJO et al.
(2001) para seleo de variveis, no contexto da calibrao multivariada,
aplicada aos modelos de regresso linear mltipla (Multiple Linear
Regression MLR).
1.7.7 Algoritmo das projees sucessivas (SPA)
A essncia do SPA consiste em buscar um conjunto pequeno e
representativo de variveis com nfase na minimizao de colinearidade
entre elas. Desta maneira, torna-se possvel usar modelos MLR que,
24 INTRODUO
embora relativamente simples e de fcil interpretao, so severamente
afetados por problemas de colinearidade (ARAJO et al., 2001).
Os fundamentos tericos, bem como os detalhes da rotina
operacional do SPA tm sido extensivamente tratados em outros trabalhos
(ARAJO et al., 2001, GALVO et al., 2001b, PONTES et al., 2005,
DANTAS-FILHO et al., 2004, HONORATO et al., 2005). Apesar disto,
importante a apresentao de um exemplo ilustrativo no contexto da
voltametria.
Considere um conjunto J = 5 variveis voltamtricas: X1 = 400 mV;
X2 = 450 mV; X3 = 500 mV; X4 = 550 mV e X5 = 600 mV para a
determinao de dois analitos (A=2) usando trs amostras de calibrao
(Xcal = 3). Ento, a rotina de operaes do algoritmo para a seleo das
variveis realizada na seguinte ordem:
1) Para o clculo das projees, usa-se como vetor (K(0)) de partida aquele que
possuir a maior norma. Contudo, os demais vetores so posteriormente testados e
aqueles mais ortogonais sero incorporados para a formao de cadeias de
variveis candidatas (Figura 1.9).
Figura 1.9 Exemplo do funcionamento do SPA para selecionar potenciais a partir de cinco variveis voltamtricas: a) Projees no plano ortogonal a X3; b) Viso espacial dos vetores no plano horizontal.
2) O programa gera J x [(Xcal - A) + 1] cadeias (K(0), N), onde K(0) pode variar de
1 at J, e N, nmero de variveis em cada cadeia, pode variar de A at Xcal. Para
este exemplo: sero geradas 5 x [(3 2) + 1] = 10 cadeias, ou seja, todas as
possveis combinaes entre K(0) e N:
X1,2 X2,2 X3,2 X4,2 X5,2
X1,3 X2,3 X3,3 X4,3 X5,3
25 INTRODUO
3) A primeira cadeia de variveis a ser formada composta pelo vetor de partida,
neste caso X3 (500 mV), alm das duas variveis mais ortogonais X1 (400 mV) e
X5 (600 mV).
4) Para se determinar qual a melhor cadeia de variveis, faz-se uma regresso por
MLR para cada uma delas, empregando-se como matriz X as intensidades de
corrente da cadeia de variveis e como matriz Y as concentraes dos dois
analitos avaliados. Realiza-se, atravs da Equao (1.5), o clculo do erro
quadrtico mdio de previso (RMSEP) de amostras de um conjunto de teste para
cada um dos modelos MLR construdos.
!"# $ %& '& &( (1.5) Em que & e '& so os valores de referncia e previsto pelo modelo, de um parmetro de interesse. O algoritmo escolhe a cadeia de variveis cujo modelo
MLR resulta no menor RMSEP.
Vale salientar que o nmero de variveis selecionadas em cada
cadeia, N, limitado pela quantidade de amostras do conjunto de
calibrao para evitar problemas com a inverso de matrizes nos modelos
MLR.
1.7.8 SPA no contexto da classificao
Recentemente, PONTES et al. (2005) adaptaram o SPA para o
contexto dos mtodos de reconhecimento de padro. Neste caso, a
informao da modelagem consiste nos dados das respostas instrumentais
(matriz X) e um vetor contendo o ndice de classe para cada amostra.
Como se trata de classificao, os valores de referncia dos y parmetros
no so disponveis para processar a estatstica do RMSEP que a funo
de custo adotada pelo SPA-MLR para a seleo das variveis (DANTAS-
FILHO et al., 2004). Portanto, quando um subconjunto de variveis sob
avaliao empregado, a funo de custo adotada o risco mdio ) de uma classificao incorreta, sendo este um critrio da Anlise
Discriminante Linear.
Esta funo calculada no conjunto de teste como:
26 INTRODUO
) *+%,-*+-( (1.6) Onde *+ o nmero de amostras do conjunto de teste e ,- risco de uma classificao incorreta da *th validao da amostra .-. Logo, ,- definido como:
,- /.-, 2-3452672- /.-, 26 (1.7) Na Equao (1.7), o numerador /.-, 2- o quadrado da distncia
de Mahalanobis entre a amostra .- (de ndice de classe 2-) e a amostra mdia, 2-, de sua classe verdadeira. Esta distncia calculada como:
/.-, 2- .-, 2-% .- 2-89 (1.8) Em que 2- e correspondem amostra mdia e a covarincia, respectivamente, e so calculadas com os dados das amostras do
conjunto de calibrao. O denominador corresponde ao quadrado da
distncia de Mahalanobis entre a amostra .- e o centro da classe incorreta mais prxima. Idealmente, ,- o maior valor possvel, de modo a validar melhor os limites entre as classes. Portanto, ser escolhida a cadeia de
variveis que resultar no menor risco mdio ) de uma classificao incorreta.
1.7.9 Quimiometria aplicada voltametria
HERRERO e ORTIZ (1999) avaliaram os aspectos qualitativos e
quantitativos da aplicao do algoritmo gentico (Genetic Algorithm GA)
no contexto da seleo de variveis em alguns exemplos envolvendo
dados polarogrficos e voltamtricos. Em todos os casos o desempenho
dos modelos PLS com e sem seleo de variveis pelo GA foi avaliada em
funo da mdia do erro absoluto relativo para a previso. No exemplo da
27 INTRODUO
determinao de benzaldedo por DPP, a mdia do erro absoluto relativo
para o modelo PLS foi de 2,10% enquanto para o modelo GA-PLS foi de
1,85%.
BESSANT e SAINI (1999) desenvolveram uma metodologia para
determinao simultnea de glicose, frutose e etanol empregando como
eletrodo de trabalho um eletrodo de platina no modificado, a voltametria
de escada de pulso duplo (Dual Pulse Staircase Voltammetry DPSV) e
ANN para a calibrao multivariada. Os voltamogramas utilizados so
resultados da subtrao da resposta do branco, que o voltamograma do
prprio eletrlito suporte (NaOH 0,1 mol L-1). Posteriormente, os
mesmos autores (BESSANT e SAINI, 2000) testaram estes dados
empregando outras tcnicas de calibrao multivariada, tais como: MLR,
regresso por componentes principais (Principal Component Regression
PCR) e PLS. Ainda assim, os resultados no superaram os obtidos com
ANN em virtude do carter no linear do etanol e de sua interao com
frutose.
PALACIOS-SANTANDER et al. (2003) aliaram a tcnica ANN a
mtodos de reduo de dimensionalidade matricial, tais como:
transformadas de Fourier (Fourier Transform FT) e Wavelet (Wavelet
Transform WT) para resolver problemas de sobreposio de sinais
eletroqumicos obtidos pela voltametria de pulso diferencial (Diferential
Pulse Voltammetry DPV). Neste estudo, utilizou-se um eletrodo de gota
pendente de mercrio (Hanging Mercury Drop Electrode HMDE) para a
determinao simultnea dos ons Tl+ e Pb2+. Este mtodo foi comparado
com as tcnicas PLS e PCR e, baseando-se na raiz do erro mdio
quadrtico (Root Mean Square Error RMSE), estabeleceu-se que o
modelo proposto mais eficiente. Paralelamente, COCCHI et al. (2003)
utilizaram esta mesma metodologia e os mesmos analitos para comparar
os resultados da calibrao multivariada empregando PLS, MLR e ANN aos
coeficientes wavelets gerados aps a compresso dos voltamogramas. Os
melhores resultados foram obtidos por MLR.
28 INTRODUO
A DPV tambm foi utilizada para elaborao de um mtodo capaz de
determinar pesticidas organofosforados, utilizando HMDE e quimiometria.
Devido alta sobreposio dos voltamogramas para estes compostos, a
quantificao foi realizada empregando comparativamente as tcnicas
PCR, PLS, mnimos quadrticos clssicos (Classical Least Square CLS),
Kalman filter (KF) e ANN. Recuperao satisfatria para um conjunto de
amostras sintticas foi obtida por ANN (NI et al., 2004).
NI et al. (2001a) desenvolveram um mtodo utilizando HMDE e DPV
para determinao simultnea de nitrobenzeno, 2-, 3-, 4-nitrofenol e 2,4-
dinitrofenol com PLS, PCR e CLS. Foram alcanados erros relativos de
previso de 10 % para PLS e PCR e 38% para CLS. Posteriormente,
esta metodologia foi utilizada na construo de um modelo de calibrao
multivariada para quatro pesticidas (carbamatos) incluindo, desta vez, o
uso de ANN. Neste caso, o erro relativo de previso foi de 5,6% (NI et al.,
2005). Este mesmo grupo utilizou eletrodo de carbono vtreo e as tcnicas
mais comuns de voltametria e calibrao multivariada para determinao
simultnea dos antioxidantes hidroxianisol butilado, hidroxi-tolueno
butilado, propil galato e tert-butilhidroquinona (NI et al., 2000) e, dos
antipsicticos cloridrato de clorpromazina e cloridrato de prometazina (NI
et al., 2001b).
cido nalidxico (antibacteriano) e seu principal metablico, cido 7-
hidroximetilnalidxico, foram determinados em urina aplicando ANN e PLS
aos voltamogramas obtidos por meio da polarografia de pulso diferencial
(Diferential Pulse Polarography DPP), SWV e mtodos de corrente
contnua (Sampled DC). Modelo PCR foi construdo e os escores obtidos
foram utilizados para o treinamento das redes neurais. Os melhores
resultados foram obtidos com ANN e DPP (GUIBERTEAU et al., 2004).
CUKROWSKA et al. (2001) desenvolveram um mtodo para
determinao simultnea de adenina e citosina utilizando padres destes
analitos para elaborar modelos de calibrao multivariada empregando
ANN. Voltametria de varredura linear (Linear Sweep Voltammetry LSV)
e DPP foram testadas neste trabalho. A tcnica LSV apresentou melhores
29 INTRODUO
resultados, com erros absolutos de 3,7% e 5,2% para adenina e citosina,
respectivamente.
BARTHUS et al. (2005) aplicaram o mtodo PLS aos dados obtidos
por SWV com eletrodo de carbono vtreo para misturas sintticas de cido
ascrbico e b-nicotinamida adenina dinucleotdeo (NADH). Foram obtidos
erros relativos mximos de 1,7% e 2,1% para NADH e cido ascrbico,
respectivamente.
PLS foi utilizado para quantificao de benzaldedo empregando a
DPP com intuito de determinar a capacidade de discriminao. Neste caso,
a calibrao univariada no pde ser aplicada devido ao aumento
caracterstico do pico com a concentrao e as leves oscilaes do pH
(SANZ et al., 2001).
SAURINA et al. (2000) utilizaram um eletrodo de grafite-metacrilato,
voltametria cclica (Ciclic Voltammetry CV) e as tcnicas quimiomtricas
PCR e PLS para a determinao simultnea de aminocidos oxidveis
(cistena, tirosina e triptofano). Desvios-padro relativos de 10% foram
obtidos para as previses de cistena e triptofano e 18% para tirosina.
Posteriormente, este mesmo grupo (SAURINA et al., 2004) desenvolveu
uma nova metodologia utilizando DPV e um eletrodo de platina para a
quantificao dos mesmos aminocidos. Esta estratgia apresentou um
bom compromisso entre sensibilidade, seletividade e reprodutibilidade
para estes analitos.
Vinhos, cervejas, cafs, leites e sucos de fruta foram analisados por
SWV com eletrodo de platina, que passou por um procedimento de
limpeza por ultra-som antes de cada amostra. PCA e HCA foram utilizadas
como tcnicas de reconhecimento de padro. Para o emprego de
calibrao multivariada por PCR e PLS, uma amostra de suco de laranja foi
diluda sucessivas vezes para construir os conjuntos de amostras
necessrios. Os resultados em termos de RMSEP foram de 4,0% e 5,4%
para PCR e PLS, respectivamente (SCHREYER e MIKKELSEN, 2000).
Um arranjo de microeletrodos de carbono vtreo reticulado foi
desenvolvido para a quantificao e classificao de bactrias utilizando
30 INTRODUO
voltametria de pulso normal (Normal Pulse Voltammetry NPV), SIMCA e
PLS. Resultados aceitveis foram obtidos em calibrao multivariada
transformando a varivel dependente em escala logartmica (log(1+yi)) e
auto-escalonando todas as variveis independentes. (Berrettoni et al.,
2004a, Berrettoni et al., 2004b).
Um algoritmo para resoluo de curva multivariada (Multivariate
Curve Resolution MCR) por mnimos quadrados alternados (Alternating
Least Square ALS) tem sido utilizado com bastante eficincia para
resoluo de sobreposio de picos em sinais eletroanalticos, inclusive,
servindo como ferramenta para investigar o processo eletroqumico
envolvido (ESTEBAN et al., 2000, CRUZ et al., 2000, DAZ-CRUZ et al.,
2000, DAZ-CRUZ et al., 20001, FERNNDEZ et al., 2001, DAZ-CRUZ et
al., 2002, ANTUNES et al., 2002, CRUZ et al., 2002).
DIAZ et al. (2004) avaliaram as tcnicas DPV, SWV e DC com intuito
de desenvolver uma metodologia para a determinao de tocoferol
(vitamina E) em amostras de leos vegetais (canola, milho, soja e oliva)
usando PLS. Utilizou-se um eletrodo de carbono vtreo e o voltamograma
do branco (eletrlito de suporte) foi registrado antes de cada medida. Os
melhores resultados foram alcanados pelo PLS-DPV, quando comparados
com os obtidos por cromatografia.
ESTEBAN et al. (2006a e b) publicaram duas revises reunindo o
uso de dados voltamtricos com diferentes aplicaes quimiomtricas:
otimizao e planejamento experimental, preparao e transformao de
dados para tratamentos posteriores, explorao de dados, classificao de
amostras e calibrao multivariada.
Recentemente, JAKUBOWSKA (2007) desenvolveu uma nova funo
wavelet me dedicada ao pr-processamento de voltamogramas levando
em considerao seu perfil, bem como as necessidades bsicas para a
anlise desse tipo de sinal como: reduo de rudo experimental, correo
da linha de base e sobreposio de picos.
A reviso literria at aqui realizada permitiu observar que poucos
trabalhos tm sido desenvolvidos explorando a unio de tcnicas
31 INTRODUO
voltamtricas com a anlise multivariada, sobretudo no contexto dos
mtodos de classificao de amostras. Diante disto, a SWV, tcnica
voltamtrica caracterizada por apresentar uma boa sensibilidade em alta
velocidade de varredura, combinada com mtodos de reconhecimento de
padro e seleo de variveis pode ser uma alternativa promissora para
classificao de diferentes tipos de leos vegetais refinados.
CAPTULO II OBJETIVOS
33 OBJETIVOS
2.1 Objetivo Geral
Neste trabalho proposto um mtodo rpido, simples e barato para
a classificao e fiscalizao de leos vegetais comestveis quanto ao
prazo de validade, que combina a voltametria de onda quadrada (SWV)
com anlise discriminante linear (LDA) associada ao algoritmo das
projees sucessivas (SPA) para a seleo de variveis.
2.1.1 Objetivos Especficos:
i) Utilizar tcnicas de planejamento experimental para otimizar as condies de
analise em SWV.
ii) Utilizar a combinao da SWV, cuja instrumentao e manuteno no so
dispendiosas quando comparadas s demais tcnicas freqentemente
adotadas (cromatografia e espectroscopia), com mtodos de reconhecimento
de padro supervisionado (SIMCA e LDA) e seleo de variveis.
iii) Aplicar PCA a partir dos voltamogramas visando discriminao de amostras
de leos vegetais refinados no vencidos e vencidos.
iv) Elaborar e validar modelos SWV-SIMCA para classificao de leos vegetais
no vencidos e vencidos.
v) Utilizar a LDA com seleo prvia de variveis (potenciais voltamtricos) pelo
SPA para a classificao de leos vegetais refinados.
vi) Comparar o desempenho dos modelos SWV-SIMCA e SWV-LDA-SPA em
termos do nmero de erros de classificao.
CAPTULO III EXPERIMENTAL
35 EXPERIMENTAL
3.1 Amostras
Cento e quatorze amostras de leos vegetais refinados, de
diferentes lotes e fabricantes, foram adquiridas em estabelecimentos
comerciais da cidade de Joo Pessoa, Paraba. Dessas amostras, 66 so
aqui denominadas no vencidas, pois foram adquiridas no perodo de
agosto a setembro de 2006 e estavam dentro do prazo de validade, e 48
so amostras com o prazo de validade expirado (PVE), que foram
adquiridas em 2004. As classes e a quantidade de amostras analisadas
so detalhadas na Tabela 3.1.
Tabela 3.1 Classes e quantidade de amostras de leos vegetais analisados.
Classes de leo Nmero de Amostras
Canola 15
Girassol 16
Milho 17
Soja 18
PVE 48
3.2 Diviso do conjunto de amostras
Antes da construo dos modelos quimiomtricos, as amostras de
cada uma das classes de leos delineadas na Tabela 3.1 foram divididas
em trs conjuntos (treinamento, teste e previso) utilizando o algoritmo
KS (KENNARD e STONE, 1969), que usado para extrair um conjunto
representativo de amostras de um determinado conjunto de dados.
Inicialmente, o KS foi aplicado de modo a gerar o conjunto de treinamento
de cada classe. Em seguida, o KS foi aplicado s amostras remanescente
de cada classe de modo a gerar o conjunto de teste. As amostras
restantes foram ento usadas como amostras do conjunto de previso. O
nmero de amostras de cada classe e de cada conjunto mostrado na
Tabela 3.2.
36 EXPERIMENTAL
Tabela 3.2 Nmero de amostras de treinamento, teste e previso selecionadas pelo KS para as cinco classes de leos vegetais.
Classes Conjuntos
Treinamento Teste Previso
Canola 9 3 3
Girassol 10 3 3
Milho 10 3 4
Soja 10 4 4
PVE 20 10 18
3.3 Materiais e reagentes
Todos os reagentes utilizados foram de grau analtico P.A. e so
listados abaixo juntamente com os materiais:
lcool etlico absoluto (ISOFAR);
Hidrxido de sdio (MERCK KGaA);
cido actico (MERCK KGaA);
gua deionizada Milli-Q (Millipore Inc);
Pipetas automticas de 2-20 e 20-200 L (Eppendorf) e de 1,00-10,0 mL (VOLAC
John Poulten Ltd);
Ponteiras (Eppendorf) descartveis de polietileno;
Vidraria;
Tubos de polipropileno de 1,5 mL (Eppendorf).
3.4 Equipamentos
A parte experimental foi realizada empregando a SWV em um
estudo eletroanaltico que possibilitasse a elaborao e avaliao de
modelos quimiomtricos de classificao de leos vegetais refinados. As
medidas foram realizadas em um potenciostato/galvanostato AutoLab
Type II da Eco Chemie acoplado ao mdulo polarogrfico 663 VA Stand
da Metrohm (Figura 3.1), equipado com um eletrodo de referncia de
Ag/AgCl KCl (3.0 mol L-1) e um fio de platina como contra eletrodo. O
eletrodo de trabalho foi escolhido entre os eletrodos de disco de platina e
de ouro e, todos
planejamentos experimentais.
Figura 3.1 Potenciostato/Galvanostato AUTOLABVA Stand da cela eletroqumica
3.5 Procedimento a
Os parmetros da voltametria de onda quadrada
os estudos preliminares foram os seguintes:
Potencial - tempo de condicionamento: 0,7 V
Potencial - tempo de deposio:
Tempo de equilbrio:
Freqncia: 20 Hz;
Janela de varredura de potencial:
platina VS. Ag/AgCl);
Incremento de potencial: 5 mV;
Amplitude de pulso: 25 mV.
Voltamogramas registrados em triplicata.
Os dois primeiros
no trabalho realizado por
um mtodo para determinao eletroqumica multivariada de
alifticos com eletrodo de disco de platina, NaOH como eletrlito de
suporte e adaptaram
trabalho.
de ouro e, todos os parmetros foram otimizados com base em
planejamentos experimentais.
Potenciostato/Galvanostato AUTOLAB Type II esquerda e o mdulo da cela eletroqumica direita.
a
Recommended