117
  UNIVERSIDADE FEDERAL DA PARAÍBA CENTRO DE CIÊNCIAS EXATAS E DA NATUREZA DEPARTAMENTO DE QUÍMICA PROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICA DISSERTAÇÃO DE MESTRADO CLASSIFICAÇÃO DE ÓLEOS VEGETAIS UTILIZANDO VOLTAMETRIA DE ONDA QUADRADA E MÉTODOS QUIMIOMÉTRICOS Francisco Fernandes Gambarra Neto  João Pessoa – P B – Brasil Fevereiro / 2008

Classificação de Óleos Vegetais Utilizando Voltametria de Onda Quadrada e Métodos Quimiométricos

Embed Size (px)

DESCRIPTION

Utilizando a quimiometria para classificacao de oleos vegetais

Citation preview

  • UNIVERSIDADE FEDERAL DA PARABA

    CENTRO DE CINCIAS EXATAS E DA NATUREZA

    DEPARTAMENTO DE QUMICA

    PROGRAMA DE PS-GRADUAO EM QUMICA

    DISSERTAO DE MESTRADO

    CLASSIFICAO DE LEOS VEGETAIS UTILIZANDO VOLTAMETRIA

    DE ONDA QUADRADA E MTODOS QUIMIOMTRICOS

    Francisco Fernandes Gambarra Neto

    Joo Pessoa PB Brasil

    Fevereiro / 2008

  • UNIVERSIDADE FEDERAL DA PARABA

    CENTRO DE CINCIAS EXATAS E DA NATUREZA

    DEPARTAMENTO DE QUMICA

    PROGRAMA DE PS-GRADUAO EM QUMICA

    DISSERTAO DE MESTRADO

    CLASSIFICAO DE LEOS VEGETAIS UTILIZANDO VOLTAMETRIA

    DE ONDA QUADRADA E MTODOS QUIMIOMTRICOS

    Francisco Fernandes Gambarra Neto

    Dissertao apresentada como

    requisito para a obteno do

    ttulo de Mestre em Qumica pela

    Universidade Federal da Paraba.

    Orientador: Prof. Dr. Mrio Csar Ugulino de Arajo

    2 Orientador: Dr. Glimaldo Marino

    Bolsista (CAPES)

    Joo Pessoa PB Brasil

    Fevereiro / 2008

  • Aos meus pais, Fernando Antnio Casimiro

    Gambarra e Ana Maria Fontes Gambarra,

    minha av, Maria de Lourdes Casimiro

    Fernandes e s minhas irms, Fernanda

    Fontes Gambarra e Fabiana Fontes

    Gambarra, por todo amor, amizade, apoio,

    ajuda e confiana.

    minha namorada, Wanessa Porto Tito, por

    todo amor, companheirismo e compreenso.

    Com muito carinho e gratido,

    Eu dedico.

  • AGRADECIMENTOS

    Em primeiro lugar agradeo a Deus por me dar disposio, fora de

    vontade e sade para realizar este trabalho.

    Aos meus grandes amigos Mrcio Jos Coelho de Pontes e Gledson

    Emdio Jos, que esto sempre do meu lado acreditando, ajudando,

    debatendo, colaborando e sempre prontos para escutarem e

    compartilharem os bons e maus momentos.

    Ao Professor Dr. Mrio Csar Ugulino de Arajo, pela orientao,

    confiana e por ter apostado em mim.

    Aos pesquisadores Dr. Glimaldo Marino e Dr. Everaldo Paulo de

    Medeiros, pelo aprendizado, ajuda, incentivo e, principalmente, pela

    amizade.

    Renato Sousa Lima, pela amizade e ajuda em uma parte do

    experimental.

    A todos do LAQA, que de uma forma ou de outra, ajudaram-me e

    fizeram-me sentir bem-vindo ao laboratrio.

    Aos demais professores do LAQA e do Departamento de Qumica, que

    me forneceram aprofundamentos disciplinares durante o Mestrado.

    Aos Professores Germano Veras e Ana Cludia, pelos conselhos,

    amizade e confiana desde a graduao pela Universidade Estadual da

    Paraba.

    A CAPES pelo fornecimento da bolsa.

  • ii

    SUMRIO

    NDICE DE FIGURAS ...................................................................... v

    NDICE DE TABELAS ...................................................................... x

    LISTA DE ABREVIATURAS E SIGLAS ............................................ xii

    RESUMO ...................................................................................... xiv

    CAPTULO I INTRODUO ............................................................. 1

    1.1 leos Vegetais ......................................................................... 2

    1.2 Composio dos leos vegetais .................................................. 3

    1.3 leos vegetais e a sade humana ............................................... 5

    1.4 Tipos de leos vegetais ............................................................. 6 1.4.1 leo de canola .................................................................... 6 1.4.2 leo de girassol .................................................................. 7 1.4.3 leo de milho ..................................................................... 8 1.4.4 leo de soja ....................................................................... 8

    1.5 Controle de qualidade de leos vegetais ..................................... 10

    1.6 Voltametria de onda quadrada .................................................. 11

    1.7 Quimiometria .......................................................................... 13 1.7.1 Pr-processamento dos dados ............................................. 14 1.7.2 Planejamentos experimentais .............................................. 16 1.7.2.1 Planejamento composto central ...................................... 16 1.7.2.2 Parmetro de Taguchi ................................................... 17

    1.7.3 Anlise de Componentes Principais (PCA) .............................. 18 1.7.4 SIMCA .............................................................................. 20 1.7.5 Anlise discriminante linear (LDA) ........................................ 22 1.7.6 Seleo de variveis ........................................................... 23 1.7.7 Algoritmo das projees sucessivas (SPA) ............................. 23 1.7.8 SPA no contexto da classificao .......................................... 25 1.7.9 Quimiometria aplicada voltametria ..................................... 26

    CAPTULO II OBJETIVOS ............................................................. 32

    2.1 Objetivo Geral ......................................................................... 33 2.1.1 Objetivos Especficos: ......................................................... 33

  • iii

    CAPTULO III EXPERIMENTAL ..................................................... 34

    3.1 Amostras ................................................................................ 35

    3.2 Diviso do conjunto de amostras ............................................... 35

    3.3 Materiais e reagentes ............................................................... 36

    3.4 Equipamentos ......................................................................... 36

    3.5 Procedimento analtico ............................................................. 37 3.5.1 Manipulao das amostras .................................................. 38 3.5.2 Eletrlito suporte, eletrodo de trabalho e sentido da varredura 39 3.5.3 Limpeza do eletrodo de trabalho e parmetros da SWV ........... 39

    3.6 Softwares ............................................................................... 42

    CAPTULO IV RESULTADOS E DISCUSSO ................................... 43

    4.1 Eficincia da extrao alcolica ................................................. 44

    4.2 Eletrlito suporte, eletrodo de trabalho e sentido da varredura ...... 45

    4.3 Limpeza eletroqumica do eletrodo de trabalho ............................ 46

    4.4 Otimizao dos parmetros da SWV ........................................... 49

    4.5 Seleo da regio de trabalho no voltamograma ......................... 51

    4.6 Perfis dos voltamogramas do etanol e de etanol + leo ................ 52

    4.7 Pr-processamento dos voltamogramas ..................................... 53 4.7.1 Pr-processamento aplicado s variveis ............................... 54

    4.8 Anlise exploratria dos dados .................................................. 55 4.8.1 Aplicao da PCA................................................................ 55 4.8.1.1 Aplicao da PCA s amostras no vencidas ..................... 56 4.8.1.2 Comparao dos leos em relao composio qumica ... 57 4.8.1.3 Aplicao de PCA s amostras da classe PVE .................... 59

    4.9 Modelagem e Classificao SWV-SIMCA...................................... 60 4.9.1 Construo dos modelos SWV-SIMCA ................................... 61 4.9.2 Validao dos modelos SWV-SIMCA ...................................... 64 4.9.2.1 Validao do modelo SWV-SIMCA da classe Canola ........... 64 4.9.2.2 Validao do modelo SWV-SIMCA da classe Girassol ......... 67 4.9.2.3 Validao do modelo SWV-SIMCA da classe Milho ............. 67 4.9.2.4 Validao do modelo SWV-SIMCA da classe Soja .............. 68 4.9.2.5 Validao do modelo SWV-SIMCA da classe PVE ............... 69

    4.9.3 Uso dos modelos SWV-SIMCA para o Conjunto de Previso ..... 72

    4.10 Construo dos modelos SWV-LDA-SPA .................................... 74

  • iv

    4.10.1 Uso do modelo SWV-LDA-SPA no Conjunto de Previso ......... 76 4.10.2 Uso do SWV-LDA-SPA para a previso de todas as amostras . 76

    4.11 Comparao entre os modelos SWV-SIMCA e SWV-LDA-SPA ....... 78

    CAPTULO V CONCLUSES ........................................................... 80

    5.1 Concluses ............................................................................. 81

    5.2 Propostas futuras .................................................................... 82

    CAPTULO VI REFERNCIAS ........................................................ 83

  • v

    NDICE DE FIGURAS

    Figura 1.1 Estrutura molecular dos principais cidos graxos dos leos

    vegetais .......................................................................................... 4

    Figura 1.2 Variao de potencial em funo do tempo para a SWV.

    Esto representados o potencial inicial, Ei, a amplitude de pulso, EP, o

    incremento de potencial, ES, a largura de pulso, tP e os pontos A e B

    onde as correntes direta e reversa so medidas, respectivamente. ........ 12

    Figura 1.3 Voltamogramas esquemticos de onda quadrada (SOUZA

    et al., 2003) para um processo redox de um sistema reversvel (1) e

    de um sistema irreversvel (2). ......................................................... 12

    Figura 1.4 Representao de uma matriz de dados de natureza

    multivariada. .................................................................................. 14

    Figura 1.5 Primeira e segunda PCs no espao tridimensional das

    variveis. ....................................................................................... 19

    Figura 1.6 Previso de uma amostra desconhecida A usando o modelo

    SIMCA da classe B construdo com uma PC. A distncia y entre a

    amostra A e o eixo da componente corresponde ao resduo da PC1, x

    a distncia entre a projeo de A na direo da PC1 e a fronteira da

    classe e z a distncia de A at o limite da classe. ........................... 20

    Figura 1.7 Grfico de Si x Hi, detalhando os limites de uma

    determinada classe 1 e a disposio das demais amostras ao seu

    redor. Neste caso, uma das amostras da prpria classe 1 foi mal

    classificada como visualizado. ........................................................... 21

    Figura 1.8 Representao esquemtica da anlise discriminante

    linear. Os centros de gravidade (os asteriscos) dos grupos formados

    por crculos e quadrados so inicialmente determinados. Em seguida

    traa-se um plano de deciso eqidistante e perpendicular linha que

    une os centros de gravidade dos grupos, formando as regies R1 e R2.

  • vi

    Se um ponto qualquer estiver presente na regio R1, o mesmo

    classificado como pertencente ao grupo 1. Caso contrrio,

    obrigatoriamente pertencer categoria 2.......................................... 22

    Figura 1.9 Exemplo do funcionamento do SPA para selecionar

    potenciais a partir de cinco variveis voltamtricas: a) Projees no

    plano ortogonal a X3; b) Viso espacial dos vetores no plano

    horizontal. ...................................................................................... 24

    Figura 3.1 Potenciostato/Galvanostato AUTOLAB Type II

    esquerda e o mdulo 663 VA Stand da cela eletroqumica direita. ..... 37

    Figura 3.2 Esquema da extrao de cidos graxos das amostras de

    leo e tomada de alquota para realizao das medidas. ....................... 38

    Figura 3.3 Quadrado do voltamograma mdio (a) e perfil da varincia

    (b). ................................................................................................ 41

    Figura 4.1 Perfil dos voltamogramas aps a subtrao do perfil de

    etanol P.A. no sentido de varredura andico para 4 diferentes

    propores de uma amostra de leo de soja em etanol. ....................... 44

    Figura 4.2 Perfil dos voltamogramas aps a subtrao do perfil de

    etanol P. A. nos sentidos de varredura andica (linha preta) e catdico

    (linha vermelha), empregando RDE-Au e o eletrlito suporte NaOH (a)

    e o CH3COOH (b); RDE-Pt e o eletrlito suporte NaOH (c) e CH3COOH

    (d). A concentrao dos eletrlitos de suporte foi 0,1 mol L-1. ............... 45

    Figura 4.3 Voltamograma de uma amostra de leo de canola (linha

    vermelha), na regio de 0,300 a -0,900 V, aps subtrair a resposta do

    branco (NaOH 0,1 mol L-1 linha azul) do voltamograma

    originalmente obtido pela SWV (linha verde). ...................................... 51

    Figura 4.4 Voltamograma de uma amostra de leo de canola na

    regio de trabalho selecionada (-0,046 a -0,900 V). ............................ 52

  • vii

    Figura 4.5 Perfis, aps subtrao do branco, dos voltamogramas do

    etanol (linha azul), de um leo de canola em etanol na proporo 1:1

    (linha vermelha) e a subtrao destes dois perfis (linha verde). O

    detalhe no canto superior esquerdo dessa figura uma ampliao da

    rea marcada nos voltamogramas. .................................................... 52

    Figura 4.6 Voltamogramas das 114 amostras de leo vegetal na

    regio de trabalho, aps a subtrao do branco: Voltamogramas das

    66 amostras de leo no vencidas (a) e das 48 amostras vencidas (b). .. 54

    Figura 4.7 Grfico dos escores de PC1 versus PC2 das 114 amostras

    de leo vegetal. .............................................................................. 55

    Figura 4.8 Grfico dos escores de PC1 versus PC2 para as 66

    amostras no vencidas de leo vegetal distribudas em quatro classes. .. 56

    Figura 4.9 Voltamogramas mdios das classes Canola, Girassol, Milho

    e Soja. A seta indica uma ampliao da regio de menor intensidade

    de corrente e o crculo destaca a regio de -580 mV a -650 mV onde o

    perfil da classe Canola se diferencia das demais. ................................. 57

    Figura 4.10 Grfico dos escores de PC1 versus PC2 das 48 amostras

    de leo vegetal da classe PVE. .......................................................... 59

    Figura 4.11 Perfil voltamtrico das amostras de leo da classe PVE. ..... 60

    Figura 4.12 Grficos da varincia residual e explicada versus n de

    PCs das classes: a) Canola; b) Girassol; c) Milho; d) Soja; e) PVE. ........ 61

    Figura 4.13 Grfico dos escores de PC1 versus PC2 versus PC3 para

    as classes: a) Canola; b) Girassol; c) Milho; d) Soja; e) PVE. As

    amostras dos conjuntos de treinamento e de teste esto pintadas de

    azul e vermelho, respectivamente. .................................................... 63

    Figura 4.14 Grfico de Si x Hi (95% de confiana) do modelo da

    classe Canola construdo com 6 PCs. A seta indica uma ampliao das

  • viii

    fronteiras deste modelo evidenciando a classificao incorreta da

    amostra 11. .................................................................................... 65

    Figura 4.15 Teste F aplicado aos resduos das amostras de

    treinamento e teste da classe Canola para modelos com 4 (a), 5(b) e 6

    (c) PCs. .......................................................................................... 65

    Figura 4.16 Grfico de Si x Hi (95% de confiana) do modelo da

    classe Canola construdo com 4 PCs aps a etapa de validao. A seta

    indica uma ampliao das fronteiras deste modelo evidenciando a

    classificao correta de todas as amostras. ......................................... 66

    Figura 4.17 Grfico de Si x Hi (95% de confiana) do modelo da

    classe Girassol construdo com 4 PCs. A seta indica uma ampliao das

    fronteiras deste modelo evidenciando a classificao incorreta de sete

    amostras de leo de soja. ................................................................. 67

    Figura 4.18 Grfico de Si x Hi (95% de confiana) do modelo da

    classe Milho construdo com 3 PCs. A seta indica uma ampliao das

    fronteiras deste modelo evidenciando a classificao incorreta de uma

    amostra de leo de soja. .................................................................. 68

    Figura 4.19 Grfico de Si x Hi (95% de confiana) do modelo da

    classe Soja construdo com 4 PCs. A seta indica uma ampliao das

    fronteiras deste modelo evidenciando a classificao incorreta de seis

    amostras de leo de girassol e de uma amostra de leo de milho. ......... 69

    Figura 4.20 Grfico de Si x Hi (95% de confiana) do modelo da

    classe PVE construdo com 3 PCs. A seta indica uma ampliao das

    fronteiras do modelo evidenciando a classificao incorreta das

    amostras 10 e 19. ........................................................................... 70

    Figura 4.21 Teste F aplicado aos resduos das amostras de

    treinamento e teste da classe PVE para modelos com 1 (a), 2(b), 3 (c)

    e 4 (d) PCs. .................................................................................... 70

  • ix

    Figura 4.22 Perfil dos resduos das amostras da classe PVE versus

    variveis para modelos com 2 (a) e 4 (b) PCs. .................................... 71

    Figura 4.23 Nmero de variveis selecionadas pelo SPA versus os

    valores da funo de custo. .............................................................. 75

    Figura 4.24 Variveis selecionadas pelo LDA-SPA. .............................. 76

    Figura 4.25 Grfico dos escores de FD1 versus FD2 das 114 amostras

    de leo vegetal. .............................................................................. 77

    Figura 4.26 Grfico dos escores de FD2 versus FD3 para as 66

    amostras no vencidas de leo vegetal distribudas em quatro classes. .. 78

  • x

    NDICE DE TABELAS

    Tabela 1.1 Principais oleaginosas e seus respectivos contedos em

    leo. ............................................................................................... 6

    Tabela 1.2 Caractersticas fsico-qumicas e composio em cidos

    graxos dos leos refinados de canola, girassol, milho e soja (Fonte:

    ANVISA, 2007). ................................................................................ 9

    Tabela 3.1 Classes e quantidade de amostras de leos vegetais

    analisados. ..................................................................................... 35

    Tabela 3.2 Nmero de amostras de treinamento, teste e previso

    selecionadas pelo KS para as cinco classes de leos vegetais. ............... 36

    Tabela 4.1 Detalhamento dos fatores e nveis utilizados para a

    construo do planejamento composto central, em que = 1,5. ........... 47

    Tabela 4.2 Planejamento composto central 24 para a otimizao da

    etapa de limpeza eletroqumica do eletrodo de trabalho. ...................... 48

    Tabela 4.3 Parmetros timos escolhidos para a limpeza

    eletroqumica do eletrodo. ................................................................ 49

    Tabela 4.4 Detalhamento dos fatores e nveis utilizados para a

    construo do planejamento composto central 23, em que = 1,67. ......... 49

    Tabela 4.5 Planejamento composto central 23. ................................... 50

    Tabela 4.6 Parmetros escolhidos para a SWV. .................................. 50

    Tabela 4.7 Matriz da composio qumica dos leos vegetais de

    acordo com os dados da RDC 492/99 (ANVISA, 2007). ........................ 58

    Tabela 4.8 Correlao entre os diferentes tipos de leo vegetal de

    acordo com a composio de qumica................................................. 58

  • xi

    Tabela 4.9 Nmero de PCs e a varincia explicada acumulada dos

    modelos SWV-SIMCA. ...................................................................... 62

    Tabela 4.10 Nmero de PCs e varincia explicada acumulada para

    cada modelo SWV-SIMCA de leo vegetal aps a etapa de validao. .... 72

    Tabela 4.11 Classificao SIMCA das amostras de previso das cinco

    classes de leo vegetal. O smbolo indica que a amostra foi

    classificada no modelo. .................................................................... 73

    Tabela 4.12 Erro de classificao dos modelos SWV-SIMCA (com

    quatro nveis de significncia) e SWV-LDA-SPA para as amostras de

    leo do conjunto de previso. ........................................................... 79

  • xii

    LISTA DE ABREVIATURAS E SIGLAS

    AcG cido Graxo

    AcGs cidos Graxos

    Ag/AgCl Eletrodo de referncia de prata/cloreto de prata

    ALS Mnimos quadrados alternados

    ANN Redes neurais artificiais

    ANVISA Agncia Nacional de Vigilncia Sanitria

    CLS Mnimos quadrados clssicos

    CNNPA Conselho Nacional de Normas e Padres para Alimentos

    CO2 Dixido de Carbono

    CV Voltametria cclica

    CVA Anlise de variveis cannicas

    DA Anlise de Discriminante

    DI Dimensionalidade inerente

    DPP Polarografia de pulso diferencial

    DPV Voltametria de pulso diferencial

    f Freqncia da onda quadrada

    FA Fase alcolica

    Fcal Valor calculado para o teste F

    Fcrit Valor crtico adotado para o teste F

    FT Transformada de Fourier

    G Risco mdio de uma classificao incorreta

    HCA Anlise de agrupamentos hierrquicos

    Hi Influncia

    HMDE Eletrodo de gota pendente de mercrio

    k Nmero de fatores no planejamento experimental

    KF Kalman filter

    KNN k-vizinhos mais prximos (k-nearest neighbours)

    LDA Anlise discriminante linear

    LDL Lipoprotena de baixa densidade (mau colesterol)

  • xiii

    LSV Voltametria de varredura linear

    MCR Resoluo de curva multivariada

    MIR Espectroscopia no infravermelho mdio

    MLR Regresso linear mltipla

    nF Nmero de experimentos de um planejamento fatorial

    NaOH Hidrxido de sdio

    NIR Espectroscopia no infravermelho prximo

    NPV Voltametria de pulso normal

    PC Componente principal

    PCA Anlise de componentes principais

    PCR Regresso por componente principal

    PLS Mnimos quadrados parciais

    PVE Prazo de Validade Expirado

    RDC Resoluo da Diretoria Colegiada

    RDE-Pt Eletrodo rotatrio de disco de platina

    RMSEP Erro quadrtico mdio de previso

    Si Raiz quadrada da varincia residual

    SIMCA Modelagem Independente Flexvel por Analogia de Classe

    SPA Algoritmo das projees sucessivas

    SWV Voltametria de onda quadrada

    tP Largura ou tempo do pulso na onda quadrada

    v Velocidade de varredura da onda quadrada

    WT Transformada Wavelet

    Xcal Matriz das amostras de calibrao

    x Distncia entre a projeo de A na direo da PC e a fronteira

    y Distncia entre a amostra desconhecida A e o eixo da PC

    z Proximidade de A at a caixa

    Z Parmetro de Taguchi

    Valor da distncia axial dos pontos no planejamento estrela

    EP Amplitude de pulso

    ES Incremento de potencial

  • xiv

    RESUMO

    A autenticidade de leos vegetais comestveis tem se tornado um assunto

    muito importante, tanto do ponto de vista comercial, devido evaso

    fiscal, como do prejuzo sade do consumidor. Assim, necessrio o

    desenvolvimento de novas metodologias analticas que possibilitem

    anlises simples, rpida e de baixo custo. A combinao de mtodos

    voltamtricos e quimiomtricos uma boa alternativa para atingir este

    objetivo. A quimiometria tem sido muito usada em dados espectroscpicos

    para uma variedade de aplicaes no campo de alimentos, medicamentos,

    ambiental, etc. Todavia, poucos trabalhos tm explorado as caractersticas

    atrativas dos mtodos voltamtricos, principalmente com relao sua

    natureza multivariada associada quimiometria. Neste trabalho

    proposto um mtodo rpido, simples e barato para fiscalizao de leos

    vegetais comestveis que combina a voltametria de onda quadrada com

    anlise discriminante linear associada ao algoritmo das projees

    sucessivas para a seleo de variveis. Sua eficincia foi avaliada

    comparando-o ao mtodo conhecido tradicionalmente como SIMCA. Cinco

    classes de leo: Canola, Girassol, Milho, Soja e os com prazo de validade

    expirado (PVE) de diferentes fabricantes foram analisadas, utilizando um

    eletrodo de disco de platina. Para as 32 amostras do conjunto de previso,

    o SIMCA apresentou 6 erros de classificao (81% de classificao

    correta), enquanto que o mtodo proposto classificou corretamente todas

    as amostras sendo, portanto, uma alternativa promissora para a

    classificao de leos vegetais e a fiscalizao quanto ao prazo de

    validade.

    Palavras chave: leos vegetais, voltametria de onda quadrada, anlise

    descriminante linear, algoritmo das projees sucessivas.

  • xv

    ABSTRACT

    The authenticity of edible vegetable oils has become a very important

    issue, both in trade due to tax evasion, and the damage caused to the

    health of the consumer. Thus, it is necessary to develop new analytical

    methodologies that allow simple, fast and low cost analysis. The

    combination of voltammetric and chemometric methods is a good

    alternative to achieve this goal. Chemometrics has been widely used in

    spectroscopic data for a variety of applications in the food, medicine, and

    environmental areas, etc. However, few studies have investigated the

    attractive characteristics of the voltammetric methods, particularly with

    respect to its multivariate nature, with chemometrics. This work proposes

    a fast, simple and cheap monitoring method for edible vegetable oils that

    combines the Square Wave Voltammetry (SWV) with Linear Discriminant

    Analysis (LDA) associated with Successive Projection Algorithm (SPA)

    employed in the variable selection. Its performance was evaluated by

    comparing it to the traditional method known as SIMCA (Soft Independent

    Modeling of Class Analogy). Five classes of oil: canola, sunflower, corn,

    soybean and the ones with expired shelf-life, from different manufacturers

    were analyzed with a platinum disk working electrode. The SWV-SIMCA

    method presented 6 errors (81% of correct classification), whereas the

    SWV-LDA-SPA method proposed classified correctly all the prediction

    samples, showing to be a promising alternative for classification and

    inspection of vegetable oils.

    Key words: vegetable oil, SWV, LDA, SPA, SIMCA.

  • CAPTULO I INTRODUO

  • 2 INTRODUO

    1.1 leos Vegetais

    leos e gorduras so substncias lipoflicas bastante utilizadas pelos

    organismos vivos, podendo ser de origem animal, vegetal ou mesmo

    bacteriana (MORETTO e FEET, 1998) e formam uma das trs maiores

    classes de produtos alimentcios, sendo as outras constitudas por

    protenas e carboidratos, e so conhecidos desde os ancestrais do homem

    pela facilidade de extrao e pelas diversas fontes e propriedades (WEISS,

    1970). A diferena entre leos e gorduras definida pela resoluo n

    20/77 do CNNPA (Conselho Nacional de Normas e Padres para

    Alimentos) que impe a temperatura de 20 C como limite inferior para o

    ponto de fuso das gorduras, ou seja, quando o ponto de fuso se situa

    abaixo deste limite, a substncia classificada como leo (lquido a

    temperatura ambiente). Contudo, o termo gordura o mais empregado

    quando o estado fsico no significante.

    O leo vegetal uma gordura obtida de plantas. extrado na

    maioria das vezes das sementes ou gros destes vegetais conhecidos

    como oleaginosos. Os leos destinados ao consumo humano so

    submetidos a um processo de refino cuja finalidade melhorar sua

    aparncia, sabor, odor e estabilidade por remoo de alguns componentes

    como: cidos graxos livres, protenas, corantes naturais, umidade e

    compostos volteis e inorgnicos (MORETTO e FEET, 1998).

    A cadeia agroindustrial de oleaginosas abrange um conjunto de

    mercados, dos quais os mais importantes so: produo e comrcio de

    gros; produo de leos vegetais (leo bruto e refinado) e produo de

    raes (COUTINHO et al., 2008). No Brasil, desde 1972 feito um

    levantamento anual sobre a safra de gros. No ano de 2003 foi observada

    uma produo de 123,6 milhes de toneladas, recorde nacional at ento.

    No ano de 2007 um novo recorde foi atingido com uma produo de 133

    milhes de toneladas, com soja e milho correspondendo a 82% do total.

    Isto ocorreu devido ao elevado preo dos gros no mercado internacional,

    fazendo do Brasil um dos maiores produtores mundiais de soja

  • 3 INTRODUO

    (BECKSTEIN, 2008). Para 2008, est previsto um aumento de 2,1% na

    safra rendendo 135,7 milhes de toneladas. A crescente demanda das

    oleaginosas responsvel direto pelo ascendente cultivo de gros (IBGE,

    2008).

    Alm do setor alimentcio, o Governo Federal brasileiro vem

    incentivando o aproveitamento dos leos vegetais como fonte energtica

    destinada a diversos segmentos, abrindo oportunidades nos setores social,

    econmico e, sobretudo, ambiental. A produo est sendo destinada para

    a estruturao do programa de produo e uso do biodiesel em muitos

    pases, principalmente no Brasil, j que diversas espcies oleaginosas, tais

    como a palma, nabo forrageiro, mamona, soja, girassol e babau, entre

    outras so cultivadas e posteriormente utilizadas como matria-prima na

    produo de biocombustvel (COUTINHO et al., 2008, BIODIESELBR,

    2008).

    Com base na expanso do mercado de leos vegetais, seu controle

    de qualidade tem se tornado um assunto importante tanto do ponto de

    vista comercial como da sade dos consumidores. Portanto, de

    fundamental importncia o constante aperfeioamento de tcnicas

    analticas simples, rpidas, robustas e de baixo custo.

    1.2 Composio dos leos vegetais

    Os leos vegetais so constitudos majoritariamente por

    triglicerdeos, que so compostos de trs molculas de cido graxo (AcG)

    com uma molcula de glicerol. As unidades acilas so os principais

    constituintes dos leos vegetais, representando cerca de 95% da massa

    molecular dos triglicerdeos. Em pequena quantidade aparecem mono e

    diglicerdeos, cidos graxos livres, glicolipdeos, protenas, fosfolipdeos,

    esteris entre outras substncias (MORETTO e FEET, 1998, WEISS, 1970,

    KRAUSE e MAHAN, 1991).

    Os AcGs so cidos monocarboxlicos de cadeia longa e com nmero

    par de tomos de carbono (4 a 30 tomos) dispostos em uma cadeia

  • 4 INTRODUO

    linear, em virtude da sua produo biolgica, que se inicia a partir de

    unidades acetato da acetil coenzima A. Podem ser saturados ou

    insaturados, com estes predominando nos leos vegetais. As ligaes

    duplas raramente se apresentam conjugadas (-CH=C=CH-), e sim,

    separadas por um grupo metilnico (-CH=CH-CH2-CH=CH-). As duplas

    ligaes impedem a rotao livre dos tomos gerando os ismeros nas

    configuraes cis, que a mais comum entre os AcGs dos leos vegetais,

    e trans. AcGs so geralmente representados pelo smbolo Cx:y(z), em que

    Cx indica o nmero de tomos de carbono que forma a cadeia linear; y e z

    indicam a quantidade de ligao dupla existente na molcula e sua(s)

    posio(es), respectivamente. (MORETTO e FEET, 1998, WEISS, 1970,

    KRAUSE e MAHAN, 1991).

    Nos leos vegetais, os AcGs mais comuns so o palmtico (C16:0) e

    o esterico (C18:0), entre os saturados, e olico (C18:1(9)), linolico

    (C18:2(9,12)) e linolnico (C18:3(9,12,15)), entre os insaturados (Figura

    1.1).

    C

    O

    OH

    C

    O

    OH

    C

    O

    OH

    C

    O

    OH

    cido PalmtidoC16:0

    cido EstericoC18:0

    cido OlicoC18:1(9)

    cido LinolicoC18:2(9,12)

    C

    O

    OH

    cido LinolnicoC18:3(9,12,15)

    Figura 1.1 Estrutura molecular dos principais cidos graxos dos leos vegetais

    Nas reas de bioqumica e nutrio, os cidos graxos so agrupados

    em famlias conhecidas como mega (). Nestas, o carbono do

    grupamento metila terminal reconhecido como posio nmero um,

    logo, a posio da primeira ligao dupla caracteriza a famlia. Por

    exemplo, o cido olico e o linolico pertencem s famlias 9 e 6,

  • 5 INTRODUO

    respectivamente (Figura 1.1). Os AcGs das famlias 6 e 3 no so

    produzidos pelo organismo humano e por isso so considerados como

    cidos graxos essenciais ao homem, sendo o cido linolico, 6, e o cido

    linolnico, 3, os mais importantes (MORETTO e FEET, 1998, KRAUSE e

    MAHAN, 1991). Todavia, o cido linolnico encontrado em baixas

    concentraes na maioria dos leos vegetais, sendo o leo de linhaa uma

    exceo com cerca de 60% (m/m) de 3 (CEOTTO, 2008).

    1.3 leos vegetais e a sade humana

    Os leos, juntamente com as gorduras, so denominados

    geralmente de lipdios e so encontrados no sangue e em diferentes

    rgos do homem. Eles desempenham funes cruciais como co-fatores

    enzimticos, transportadores de eltrons, pigmentos que absorvem

    radiaes luminosas, ncoras hidrofbicas, agentes emulsificantes,

    hormnios, mensageiros intracelulares, componentes da estrutura celular

    e como reservas de energia (LEHNINGER et al., 1995, KRAUSE e MAHAN,

    1991). Esta importante fonte de combustvel para os seres humanos

    contribui, em alguns pases, com 30-40% do total de energia consumida

    na alimentao. Entretanto, quando ingeridos em excesso e/ou sem levar

    em considerao a qualidade e o tipo da gordura, podem causar graves

    problemas como a obesidade, o aumento de colesterol no sangue e

    cardiopatias. Estas complicaes so atribudas maior proporo de

    cidos graxos saturados que aparecem principalmente em gorduras

    animais, manteigas e em produtos derivados da hidrogenao de leos

    como as margarinas. Por outro lado, as gorduras insaturadas so capazes

    de reduzir o ndice de colesterol, diminuindo os problemas

    cardiovasculares. Como os leos vegetais so ricos em cidos graxos

    insaturados, eles so os mais indicados para uma dieta saudvel

    (MORETTO e FEET, 1998, KRAUSE e MAHAN, 1991).

    Os cidos graxos linolico (6) e linolnico (3), ambos

    poliinsaturados, fazem parte de um grupo especial de cidos graxos, cuja

  • 6 INTRODUO

    ingesto muito importante, pois ajudam na reduo dos nveis de

    colesterol no sangue e desempenham funes fisiolgicas imprescindveis

    nos organismos vivos, sendo, portanto, essenciais vida (LEHNINGER et

    al., 1995, KRAUSE e MAHAN, 1991).

    1.4 Tipos de leos vegetais

    Existe uma grande diversidade de oleaginosas em todo o mundo.

    Algumas das mais importantes esto listadas na Tabela 1.1.

    Tabela 1.1 Principais oleaginosas e seus respectivos contedos em leo.

    Material oleaginoso leo (% em massa)

    Copra 66-68

    Babau 60-65

    Gergelim 50-55

    Polpa de palma (dend) 45-50

    Caroo de palma 45-50

    Amendoim 45-50

    Colza (canola) 40-45

    Girassol 35-45

    Aafro 30-35

    Oliva 25-30

    Algodo 18-20

    Soja 18-20

    De acordo com a Agncia Nacional de Vigilncia Sanitria, em sua

    resoluo RDC 482/99 (ANVISA, 2007), so comercializados no Brasil os

    seguintes leos vegetais:

    algodo milho palma amendoim soja palmiste arroz uva oliva canola babau gergelim girassol cco azeite saborizado

    A seguir, so apresentadas caractersticas de quatro destes leos, a

    saber, canola, girassol, milho e soja.

    1.4.1 leo de canola

    Este leo conhecido desde os primeiros sculos da Era Crist como

    produto de extrao de uma planta chamada colza. No entanto, ela

  • 7 INTRODUO

    comeou a participar da alimentao humana somente a partir da dcada

    de 1970, quando cientistas conseguiram, atravs de melhoramento

    gentico, desenvolver espcies dessa planta (Brassica nabus e Brassica

    campestris) com teores aceitveis de cido ercico e glucosilonatos. O

    nome canola (Canadian Oil Low Acid) foi oficialmente aceito pela

    Canadian Grain Commission, em 1987 (MORETTO e FEET, 1998).

    Atualmente a canola cultivada em diversos pases, sendo China,

    Canad, ndia, Alemanha, Frana, Austrlia e Polnia os maiores

    produtores mundiais (GAZZONI, 2007). No Brasil, os trabalhos de

    pesquisa com a cultura de colza nos estados do Rio Grande do Sul e de

    Santa Catarina foram iniciados em 1974, em meados dos anos 80 no

    Paran (PR) e em 2003 no estado de Gois (GO). Os gros de canola

    produzidos no pas possuem cerca de 24 a 27% de protena e de 34 a

    40% de leo (EMBRAPA, 2007a).

    O leo de canola um dos mais saudveis, pois possui elevada

    quantidade de 3, gorduras monoinsaturadas e vitamina E, que ajudam a

    diminuir o LDL (low density lipoprotein), mais conhecido como mau

    colesterol. Alm disso, possui menor quantidade de gordura saturada

    (6%) quando comparados com leos de soja (15%) e de milho (11%)

    (MORETTO e FEET, 1998, EMBRAPA, 2007a, EMBRAPA, 2007b).

    1.4.2 leo de girassol

    O girassol (Helianthus annus L.) uma planta de origem americana,

    que foi utilizada como alimento pelos ndios. um dos poucos vegetais

    que pode ser cultivado em clima frio (ANVISA, 2007, WEISS, 1970).

    Atualmente, os maiores produtores mundiais so a Rssia, Estados

    Unidos, Argentina e China. O girassol ocupa o quarto lugar como fonte de

    leo comestvel, perdendo para soja, palma e canola. A produo

    brasileira ainda pouco expressiva, mas o pas tem importado este gro,

    principalmente da Argentina, para atender a demanda comercial deste

    produto, uma vez que o leo de girassol vem sendo indicado em dietas

    por sua baixa quantidade de cidos graxos saturados, alto teor de cido

  • 8 INTRODUO

    linolico e vitaminas, alm de apresentar caractersticas organolpticas

    agradveis (ABOISSA, 2007, CAMPESTRE, 2006).

    1.4.3 leo de milho

    O milho (Zea mays L.) um dos cereais mais cultivados por todo o

    mundo. Originou-se nas Amricas e logo foi difundido pela Europa, frica

    e sia. Atualmente, os maiores produtores mundiais so os Estados

    Unidos, entretanto, outros pases como Canad, China, Pases Blticos,

    Brasil, Mxico, Argentina e frica do Sul tm uma produo significativa

    deste gro. No Brasil, o milho o cereal mais cultivado depois da soja

    (MORETTO e FEET, 1998, IBGE, 2008).

    Os principais cidos graxos que compem o leo de milho so o

    linolico (at 62%) e olico (at 42%). O cido linolnico (tri-insaturado)

    altamente sujeito oxidao e est presente em pequena percentagem

    neste leo, quando comparado ao de soja. Geralmente, os triglicerdeos

    do leo de milho apresentam a cadeia poliinsaturada na posio central do

    glicerol (carbono 2), cercada por duas cadeias saturadas, ou por uma

    cadeia saturada e uma insaturada nas extremidades (carbono 1 e 3). Esta

    configurao fornece cadeia poliinsaturada uma proteo contra os

    processos oxidativos, aumentando a estabilidade, j que as posies 1 e 3

    so a mais reativas (MORETTO e FEET, 1998, RODRIGUES et al., 2003,

    REGINA e SOLFERINI, 2007).

    1.4.4 leo de soja

    A soja (Glycine max L.) a oleaginosa mais cultivada no Brasil, que

    ocupa a 2 posio do ranking mundial da produo, perdendo apenas

    para os Estados Unidos (IBGE, 2008, GAZZONI, 2007). Esta oleaginosa

    domina o mercado mundial tanto de protena vegetal como de leo

    comestvel (MORETTO e FEET, 1998). O gro de soja possui cerca de 40%

    de protenas, 20% de lipdios (leo), 5% de minerais e 34% de

    carboidratos, alm de minerais como potssio, clcio, fsforo, ferro,

    cobre, magnsio e sdio. Os principais AcGs que compem o leo de soja

  • 9 INTRODUO

    so o linolico, olico, palmtico e linolnico. Estas caractersticas fazem

    da soja e seus derivados um importante fator para a balana comercial

    brasileira. A vantagem do leo de soja em relao a outros se deve ao seu

    baixo preo aliado sua boa qualidade. No Brasil, alm de ser utilizado na

    alimentao e em diversos outros setores, o leo de soja vem se

    destacando na produo de biodiesel, abrindo tambm as possibilidades

    para a utilizao dos demais leos vegetais, uma vez que eles se

    tornaram o principal insumo para a produo de biodiesel (EMBRAPA,

    2007c, CAMPESTRE, 2007).

    A Tabela 1.2 abaixo detalha as caractersticas fsico-qumicas e os

    cidos graxos presentes nos leos refinados de canola, girassol, milho e

    soja de acordo com a RDC 482/99 da ANVISA (2007).

    Tabela 1.2 Caractersticas fsico-qumicas e composio em cidos graxos dos leos refinados de canola, girassol, milho e soja (Fonte: ANVISA, 2007).

    Canola Girassol Milho Soja

    Caractersticas

    fsico-qumicas

    ndice de Refrao (40C)

    1,465-1,467 1,467-1,469 1,465-1,468 1,466-1,470

    ndice de Iodo (Wijs) 110-126 110-143 103-128 120-143 ndice de Saponificao 182-193 188-194 187-195 189-195 Matria Insaponificvel (g/100g)

    < 2,0 < 1,5 < 2,8 < 1,5

    Acidez (g de cido olico/100g)

    < 0,3 < 0,3 < 0,3 < 0,3

    ndice de Perxido (meq/Kg) < 10,0 < 10,0 < 10,0 < 10,0

    Brassicasterol (g/100g) > 5,0

    cidos graxos (g/100g)

    C < 14 < 0,4 < 0,3 < 0,1 Mirstico - C14:0 < 0,2 < 0,5 < 0,1 < 0,5 Palmtico - C16:0 2,5-6,5 3,0-10,0 9,0-14,0 7,0-14,0 Palmitolico - C16:1 < 0,6 < 1,0 < 0,5 < 0,5 Esterico - C18:0 0,8-3,0 1,0-10,0 0,5-4,0 1,4-5,5 Olico (9) - C18:1 53,0-70,0 14,0-35,0 24,0-42,0 19,0-30,0 Linolico (6) - C18:2 15,0-30,0 55,0-75,0 34,0-62,0 44,0-62,0 Linolnico (3) - C18:3 5,0-13,0 < 0,3 < 2,0 4,0-11,0 Araqudico - C20:0 0,1 - 1,2 < 1,5 < 1,0 < 1,0 Eicosenico - C20:1 0,1 - 4,3 < 0,5 < 0,5 < 1,0 Behnico - C22:0 < 0,6 < 1,0 < 0,5 < 0,5

    Lignocrico - C24:0 < 0,2 < 0,5 < 0,5 Ercico- C22:1 < 2,0 < 0,5 Tetracosenico C24:1 < 0,2 < 0,5

  • 10 INTRODUO

    1.5 Controle de qualidade de leos vegetais

    A comunidade cientfica mundial tem proposto diversos mtodos

    para o controle de qualidade de leos vegetais. Critrios de qualidade

    qumicos e fsico-qumicos tm sido determinados por espectrometria no

    infravermelho prximo (Near Infrared NIR) e no mdio (Mid Infrared

    MIR) (HENDL et al., 2001, FRANCO et al., 2006, BARTHUS e POPPI, 2001,

    CHRISTY e EGEBERG, 2006, WANG et al., 2006, GUILLN e CABO, 1997).

    Tambm so empregadas outras tcnicas como cromatografia (MALAVIA,

    2007), fluorescncia (SIKORSKA et al., 2005, POULLI et al., 2005, POULLI

    et al., 2006) e quimiluminescncia (STEPANYAN et al., 2005,

    PAPADOPOULOS, 2002).

    Mtodos quimiomtricos tm sido comumente aplicados a dados

    cromatogrficos e espectroscpicos com a finalidade de comparao,

    discriminao e classificao na avaliao da autenticidade de leos

    vegetais. Neste contexto, as tcnicas estatsticas multivariadas mais

    utilizadas so: k-vizinhos mais prximos (k-Nearest Neighbours KNN)

    (SIKORSKA, 2005), anlises de discriminante (Discriminant Analysis

    DA) (SIKORSKA et al., 2005, LANKMAYR et al., 2004, MARTN et al.,

    1999, LAI et al., 1994, BAETEN et al., 1998, VONCINA et al., 2005, NAGY

    et al., 2005, LEE et al., 2001, KEMSLEY, 1996), anlise de agrupamentos

    hierrquicos (Hierarchical Cluster Analysis HCA) (POULLI et al., 2005),

    anlise de componente principal (Principal Component Analysis PCA)

    (POULLI et al., 2005, DIAZ et al., 2005, LEE et al., 1998, LANKMAYR et

    al., 2004, LAI et al., 1994, LEE et al., 2001, KEMSLEY, 1996), modelagem

    flexvel independente por analogia de classe (Soft Independent Modelling

    of Class Analogy SIMCA) (DIAZ et al., 2005), anlise de variveis

    cannicas (Canonical Variables Analysis CVA) (ALVES et al., 2005),

    mnimos quadrados parciais (Partial Least Squares PLS) (CHRISTY et

    al., 2004, MARQUEZ et al., 2005, KEMSLEY, 1996), redes neurais

    artificiais (Artificial Neural Networks ANN) (VONCINA et al., 2005,

    HUSAIN et al., 1996) e algoritmo das projees sucessivas (Successive

    Projection Algorithm SPA) (PONTES et al., 2005).

  • 11 INTRODUO

    A maioria das tcnicas citadas acima possui como desvantagem o

    alto custo dos equipamentos e manuteno, quando comparadas com a

    voltametria de onda quadrada (Square Wave Voltammetry SWV) que

    utiliza instrumentao simples e de custo relativamente baixo.

    1.6 Voltametria de onda quadrada

    A SWV foi criada na dcada de 1950 quando Barker aplicou pulsos

    de potencial a um eletrodo gotejante de mercrio e chegou polarografia

    de onda quadrada (BARD e FAULKNER, 2001, SOUZA et al., 2003).

    Ramaley e Krause basearam-se nos trabalhos de Barker para

    desenvolver a teoria da voltametria de onda quadrada utilizando eletrodos

    estacionrios com o intuito de eliminar os rudos provenientes do capilar

    de mercrio. A partir da, a SWV pde ser utilizada para a anlise de

    traos com a vantagem da possibilidade de substituio do eletrodo de

    mercrio por um eletrodo slido (RAMALEY e KRAUSE, 1969, KRAUSE e

    RAMALEY, 1969). Nestes trabalhos, os autores se limitaram a saltos de

    pequeno incremento de potencial, resultando em baixas velocidades de

    varreduras.

    As limitaes da metodologia desenvolvida por RAMALEY e KRAUSE

    (1969) foram analisadas por CHRISTIE et al. (1977) e TURNER et al.

    (1977), para ento, chegar ao modelo atual da SWV, em que as leituras

    de correntes em funo dos pulsos de potenciais aplicados so feitas a

    velocidades maiores.

    A SWV consiste em aplicar, ao eletrodo de trabalho, dois pulsos de

    potenciais simtricos sobre cada degrau de uma escada de potencial. Um

    dos pulsos aplicado no sentido da escada de potencial (direto) e o outro,

    no sentido reverso. A corrente medida no final de cada pulso, fechando

    um ciclo de onda quadrada (SKOOG et al., 2002, WANG, 2006, BARD e

    FAULKNER, 2001).

    A Figura 1.2 ajuda a definir os principais parmetros da onda

    quadrada, que se caracteriza por uma amplitude de pulso, EP, medida

  • 12 INTRODUO

    com relao a cada degrau da escada, e uma largura de pulso, tP, dada

    em tempo e que tambm pode ser expressa em termos da freqncia da

    onda quadrada, f = 1/2tP. A varredura comea num potencial inicial, Ei,

    ento, no final de cada ciclo a escada aumenta instantaneamente por um

    incremento de potencial, ES. Conseqentemente, a velocidade de

    varredura, v = ES/2tP, pode ser dada por v = ES x f. O sinal obtido

    como uma intensidade de corrente de forma diferencial entre as correntes

    nos sentidos direto e reverso, apresentando excelente sensibilidade e alta

    rejeio a correntes capacitivas (BARD e FAULKNER, 2001, SOUZA et

    al.,2003, SOUZA et al., 2004).

    Figura 1.2 Variao de potencial em funo do tempo para a SWV. Esto representados o potencial inicial, Ei, a amplitude de pulso, EP, o incremento de potencial, ES, a largura de pulso, tP e os pontos A e B onde as correntes direta e reversa so medidas, respectivamente.

    O pico voltamtrico resultante apresenta posio, largura e altura

    caractersticas do tipo de sistema redox (WANG, 2006, SOUZA et al.,

    2004). A Figura 1.3 apresenta os voltamogramas tericos associados a um

    sistema reversvel e irreversvel com a separao observada das correntes

    direta, reversa e resultante.

    Figura 1.3 Voltamogramas esquemticos de onda quadrada (SOUZA et al., 2003) para um processo redox de um sistema reversvel (1) e de um sistema irreversvel (2).

  • 13 INTRODUO

    A principal vantagem da SWV a possibilidade de se obter correntes

    de pico bem definidas em experimentos executados em alta velocidade de

    varredura, resultando em anlises mais rpidas e com alta sensibilidade.

    Alm disso, por tratar-se de uma tcnica de pulso, a corrente faradaica

    pode ser registrada no final do pulso, instante no qual a contribuio da

    corrente capacitiva minimizada (BARD e FAULKNER, 2001).

    A voltametria ganhou grande importncia na qumica analtica

    medida que os equipamentos e as tcnicas foram se aperfeioando

    (SKOOG et al., 2002). Entretanto, estas tcnicas ficaram limitadas,

    principalmente, a aplicaes em calibrao univariada. Um perfil

    voltamtrico apresentando vrias sobreposies de picos analticos que,

    em geral, parece ser um grave problema, na verdade um excesso de

    informaes valiosas muito prximas umas das outras, que podem ser

    extremamente teis quando mtodos quimiomtricos so empregados

    para extrair o mximo de informaes possveis (HERRERO e ORTIZ,

    1999).

    1.7 Quimiometria

    O ascendente avano tecnolgico faz com que a qumica, sobretudo

    a qumica analtica moderna, ocupe um lugar de destaque na Cincia.

    Atualmente, existem diversas tcnicas analticas que podem gerar grande

    quantidade de dados em curto intervalo de tempo. Estes dados

    apresentam uma gama de informao de natureza multivariada e, muitas

    vezes, complexa, o que torna importante o uso de ferramentas que

    permitam extrair, de um modo mais criterioso, o maior nmero possvel

    de informaes relevantes. Neste contexto, torna-se extremamente til o

    uso da Quimiometria (MASSART et al., 1997, KOWALSKI, 1984, BEEBE et

    al., 1998), que pode ser definida como um conjunto de mtodos

    matemticos e/ou estatsticos utilizados para planejar ou selecionar

    experimentos de forma otimizada e extrair o mximo de informao

    qumica dos dados obtidos (FERREIRA et al., 1999).

  • 14 INTRODUO

    A quimiometria agrupa vrias ferramentas extremamente teis para

    planejamento e otimizao de experimentos (PIMENTEL et al., 1998,

    HONORATO et al., 2002), processamento de sinais (GALVO et al., 2004,

    GALVO et al. 2001a), seleo de variveis e amostras (PONTES et al.,

    2005, DANTAS-FILHO et al., 2004, ARAUJO et al., 2001, GALVO et al.,

    2001b), reconhecimento de padres e classificao de amostras (PONTES

    et al., 2005, COSTA et al., 2004), calibrao multivariada (DANTAS-FILHO

    et al., 2004, ARAUJO et al., 2001, GALVO et al., 2001b), transferncia de

    calibrao (HONORATO et al., 2005), entre outros.

    Uma Tabela, representada por uma matriz Amxn (Figura 1.4)

    utilizada para apresentar os dados de natureza multivariada. Nela,

    geralmente as amostras (objetos) esto localizadas nas linhas e as

    variveis, que so medidas de alguma propriedade das amostras, so

    distribudas nas colunas. No caso de dados voltamtricos, as variveis so

    os valores de corrente registrados em cada potencial que compe a janela

    de varredura.

    Figura 1.4 Representao de uma matriz de dados de natureza multivariada.

    1.7.1 Pr-processamento dos dados

    Os dados obtidos de uma anlise, tambm conhecidos como dados

    brutos, podem apresentar diversas fontes de variao causando

    irregularidades sistemticas na linha de base, rudos instrumentais ou

    variveis de diferentes unidades e magnitudes. Ento, antes da realizao

    da modelagem multivariada propriamente dita, faz-se necessrio um pr-

    processamento para remover as fontes indesejveis de variaes que

    possam atingir as variveis e/ou amostras do conjunto de dados como um

    todo (MASSART et al., 1997, FERREIRA et al., 1999).

  • 15 INTRODUO

    Existem basicamente trs tipos de pr-processamento aplicveis s

    variveis: a centralizao dos dados na mdia, que consiste na subtrao

    dos elementos de cada linha pela mdia da sua respectiva coluna, o

    escalonamento, onde cada elemento de uma linha dividido pelo desvio

    padro da sua respectiva varivel, fazendo com que todos os eixos da

    coordenada sejam conduzidos mesma escala e, conseqentemente,

    cada varivel fica com o mesmo peso, e o auto-escalonamento, que

    consiste em centralizar os dados na mdia e efetuar o escalonamento.

    Desta forma, as variveis tero mdias zero e desvios padres igual a um.

    Tanto o escalonamento quanto o auto-escalonamento so utilizados

    quando se pretende atribuir a mesma importncia s variveis do sistema

    de investigao (MASSART et al., 1997, BEEBE et al., 1998).

    Alm do pr-processamento dos dados aplicado s variveis,

    devem-se considerar tambm as variaes existentes entre as amostras.

    Para contornar tais problemas, mtodos como a normalizao, a

    derivao, a filtragem de rudo aleatrio, entre outros so bastante

    utilizados. A normalizao aplicada quando se deseja remover variaes

    sistemticas presentes na amostra. Ela realizada dividindo cada varivel

    por uma constante que escolhida a partir de uma anlise preliminar dos

    dados. Os mtodos de derivao so comumente aplicados quando, em

    um conjunto de dados, deseja-se corrigir problemas relacionados com a

    variao da linha de base. Alm disso, o mtodo da derivao muito til

    para permitir uma melhor visualizao de picos existentes nos sinais

    originais. Contudo, uma avaliao prvia dos dados deve ser realizada,

    pois as respostas instrumentais so compostas de sinais verdadeiros e

    rudos aleatrios que podem aparecer com baixa ou alta intensidade.

    Portanto, o mtodo derivativo pode, em muitos casos, super-dimensionar

    a presena de eventuais rudos presentes nas amostras (MASSART et al.,

    1997, BEEBE et al., 1998).

    Vale salientar que, o uso de um ou outro mtodo de pr-

    processamento, seja ele aplicado s amostras e/ou variveis, deve ser

    previamente avaliado procurando sempre tomar as decises mais

  • 16 INTRODUO

    coerentes de acordo com a natureza dos dados. Para isto, muito

    importante ter conhecimento aprofundado sobre o sistema em estudo.

    1.7.2 Planejamentos experimentais

    Diversas variveis influenciam a qualidade dos dados e resultados

    obtidos por voltametria. Ainda assim, tcnicas quimiomtricas de

    planejamento experimental tm sido pouco exploradas na otimizao

    dessas variveis.

    Planejamentos experimentais tpicos podem ser aplicados no

    contexto da qumica eletroanaltica, s vezes, sendo necessrio um ou

    mais planejamentos para atingir o objetivo final. Sempre que possvel, os

    parmetros destas tcnicas como incremento de potencial e amplitude de

    pulso, entre outros no caso da voltametria, devem ser avaliados de modo

    a garantir que o mtodo seja sensvel, preciso e exato.

    Por conveno, adotam-se as seguintes notaes para o uso de

    planejamento experimental:

    Fatores: so as variveis controladas

    Valor das variveis (Nveis): so valores dos fatores compreendendo a regio de

    investigao.

    Resposta do experimento: o valor, alvo da otimizao, obtido para cada

    experimento.

    1.7.2.1 Planejamento composto central

    O planejamento composto central uma opo vantajosa ao

    planejamento fatorial completo de trs ou mais nveis, por fornecer igual

    ou menor nmero de experimentos. Em geral, um planejamento composto

    central para k fatores formado por trs partes:

    Um planejamento fatorial completo ou fracionrio de dois (2) nveis e k fatores,

    contendo nF = 2k experimentos;

    Um planejamento axial ou estrela, formado por 2k experimentos e com todos os

    fatores nulos, exceto um, que igual a um certo valor ou -;

    Um ponto central, que deve ser repetido determinado nmero de vezes.

  • 17 INTRODUO

    Desta forma, o total de experimentos distintos ser: nF + 2k + 1.

    O valor da distncia axial dos pontos no planejamento estrela, ,

    geralmente estabelecido usando-se o conceito de rotabilidade em que 2 . Um planejamento rodvel se a varincia de suas estimativas s depender da distncia em relao ao ponto central, ou seja, se a

    preciso da resposta prevista for a mesma em todos os pontos situados

    numa hiperesfera com centro no prprio centro do planejamento. Esta

    propriedade esfrica um critrio de projeto usado quando o

    planejamento fatorial completo. No entanto, no importante ter uma

    rotabilidade exata para se ter um bom planejamento. (BARROS-NETO et

    al., 2003, CALADO e MONTGOMERY, 2003).

    1.7.2.2 Parmetro de Taguchi

    Taguchi (MASSART et al., 1997) interessou-se pela problemtica de

    como usar planejamento experimental para diminuir a disperso em

    torno de um valor desejado e conseqentemente aumentar a robustez de

    um produto. Sua idia consiste basicamente de dois elementos: 1)

    resposta e 2) planejamento experimental que permite a maximizao da

    resposta.

    A resposta caracterizada pelo valor e sua disperso quando o

    experimento replicado. Neste caso, o valor da resposta e a disperso

    so dados pelas Equaes (1.1) e (1.2), respectivamente:

    (1.1)

    (1.2)

    onde a mdia das respostas, chamada de sinal e a varincia, chamada de rudo. A proposta de Taguchi (Equao 1.3) foi maximizar a

    relao sinal/rudo.

  • 18 INTRODUO

    10 10 10 10 log log log log (1.3) Isto equivalente a minimizar o desvio padro relativo, ou seja, melhorar

    a preciso do mtodo utilizado.

    Uma vez que um mtodo analtico otimizado atravs de

    planejamentos estatisticamente bem estabelecidos, os sinais, por ele

    obtidos, tornam-se mais adequados ao emprego de ferramentas

    quimiomtricas para a construo de modelos de classificao e/ou

    calibrao multivariada.

    1.7.3 Anlise de Componentes Principais (PCA)

    A PCA uma tcnica quimiomtrica de reconhecimento de padres

    no-supervisionado cujo princpio fatorar um conjunto de dados de

    natureza multivariada, objetivando a representao das variaes

    existentes na forma de componentes principais (PCs) (Figura 1.5). As PCs

    so as representaes dos novos eixos formados a partir da combinao

    linear das variveis originais e nelas est contida toda a informao dos

    dados na forma de varincia. Elas so sempre ortogonais

    (perpendiculares) umas as outras, e sucessivas PCs descrevem

    quantidades decrescentes da varincia explicada dos dados, de modo que

    a informao relevante est contida nas primeiras componentes. Por esta

    razo, poucas PCs so necessrias para que toda ou a maior parte da

    varincia dos dados seja explicada, permitindo que os dados multivariados

    sejam interpretados em dimensionalidades plausveis percepo humana

    (MASSART et al., 1997, BEEBE et al., 1998, FERREIRA et. al., 1999).

  • 19 INTRODUO

    Figura 1.5 Primeira e segunda PCs no espao tridimensional das variveis.

    A contribuio que cada varivel original exerce sobre uma

    determinada PC denominada peso, que pode ser definido,

    matematicamente, como sendo o cosseno do ngulo entre o eixo da

    varivel e o eixo da PC. Da mesma forma que as amostras tm

    coordenadas definidas pelas variveis originais, elas tambm as possuem

    em relao aos novos eixos (PCs), onde so denominadas escores das

    amostras. Um determinado nmero (menor do que o total) de PCs no

    consegue descrever toda a varincia dos dados, ento essa parte no

    descrita ser representada em uma nova matriz chamada de resduos

    (MASSART et al., 1997, BEEBE et al., 1998).

    O nmero de PCs suficiente para descrever a informao dos dados

    definido como sendo a dimensionalidade inerente (DI) ou posto da

    matriz. A DI deve-se s caractersticas fsicas e/ou qumicas encontradas

    no conjunto de dados, que esto mascaradas pela presena de correlao

    entre as variveis e rudos. Para que a DI seja alcanada, imprescindvel

    definir o nmero adequado de PCs que fornecem as informaes de

    interesse para o analista, excluindo o mximo de rudo sem comprometer

    as informaes pertinentes melhor interpretao dos dados. Por isso,

    recorre-se ao uso de ferramentas de diagnstico, que investigam e

    exploram trs aspectos do conjunto de dados: o modelo, as amostras e as

    variveis. Dentre estas ferramentas, pode-se citar o grfico dos resduos,

    o grfico da varincia explicada, grfico dos escores e o grfico dos pesos.

  • 20 INTRODUO

    Outro ponto to importante quanto determinao do nmero de

    PCs a deteco de amostras anmalas (outliers), que apresentam

    caractersticas diferentes e afetam os resultados obtidos. Estas amostras

    devem, portanto, ser removidas do conjunto de dados (MASSART et al.,

    1997, BEEBE et al., 1998). importante ressaltar que o descarte de uma

    ou mais amostras do modelo deve ser efetivamente avaliado utilizando

    diversos tipos de ferramentas de diagnstico. Desconsiderar a

    variabilidade existente do conjunto de dados como um todo e adotar, com

    pouca informao a priori, uma amostra como sendo outlier pode

    prejudicar o desempenho dos modelos.

    PCA uma tcnica bastante utilizada como base para outras

    tcnicas quimiomtricas multivariadas como, por exemplo, o SIMCA, que

    uma tcnica de reconhecimento de padro supervisionado.

    1.7.4 SIMCA

    O SIMCA um mtodo de reconhecimento de padro supervisionado

    no qual cada classe individualmente modelada por PCs (KOWALSKI,

    1984). Para cada classe ou grupo de amostras previamente estabelecido,

    um modelo PCA construdo delimitando estatisticamente uma regio

    espacial. Amostras futuras podem ser avaliadas como pertencentes sua

    classe verdadeira se possurem caractersticas que possam ser inseridas

    no espao multidimensional de um dos agrupamentos (BEEBE et al.,

    1998, FLATEN et al., 2004), ou seja, a amostra classificada como

    pertencente a uma dada classe se apresentar varincia dentro de um

    valor crtico determinado pelo modelo. Obtm-se este valor em funo do

    valor de z2 (Figura 1.6) calculado pela Equao (1.4).

    Figura 1.6 Previso de uma amostra desconhecida A usando o modelo SIMCA da classe B construdo com uma PC. A distncia y entre a amostra A e o eixo da componente corresponde ao resduo da PC1, x a distncia entre a projeo de A na direo da PC1 e a fronteira da classe e z a distncia de A at o limite da classe.

  • 21 INTRODUO

    z2 = x2 + y2 (1.4)

    O valor z2 convertido a uma varincia e dividido pela varincia das

    amostras da classe B para formar um valor F calculado, Fcal. Utiliza-se,

    ento, o teste F, em que um valor crtico, Fcrit, escolhido empiricamente

    ou a partir de uma tabela do teste F. Se o Fcal for menor do que o valor

    crtico adotado, a amostra desconhecida pode ser classificada como

    pertencente classe B (MASSART et al., 1997, BEEBE et al., 1998).

    Uma das ferramentas utilizadas pelos pacotes quimiomtricos para

    mostrar os resultados da classificao SIMCA uma tabela de asteriscos,

    em que a presena dos mesmos representa que a amostra foi classificada

    como pertencente ao modelo elaborado. Outra forma o grfico

    bidimensional Si x Hi (Figura 1.7). Este grfico detalha os dois limites

    usados para a classificao: a distncia da amostra em relao ao modelo

    da classe selecionado (raiz quadrada da varincia residual, Si) e a

    influncia (Leverage, Hi) que a distncia das amostras projetada ao

    centro do modelo. Ento, amostras que se encontrarem dentro de ambos

    os limites definidos pelo modelo especfico, pertencero classe em

    questo (CAMO, 1998).

    Figura 1.7 Grfico de Si x Hi, detalhando os limites de uma determinada classe 1 e a disposio das demais amostras ao seu redor. Neste caso, uma das amostras da prpria classe 1 foi mal classificada como visualizado.

  • 22 INTRODUO

    Dois tipos de erros podem ocorrer em um estudo de classificao:

    Erro do Tipo I (Falso-Positivo): amostra avaliada no classificada em sua prpria

    classe.

    Erro do Tipo II (Falso-Negativo): amostra avaliada classificada em uma classe

    errada.

    Em SIMCA, a mesma amostra pode apresentar erros do Tipo I e do

    Tipo II simultaneamente, quando deixar de classificar em sua classe

    verdadeira e classificar em uma ou mais classes erradas.

    1.7.5 Anlise discriminante linear (LDA)

    A anlise discriminante linear (LDA) uma tcnica que consiste em

    estimar uma combinao linear de duas ou mais variveis independentes

    obtendo uma funo linear, que pode distinguir os pontos relativos aos

    dados de dois ou mais grupos. Se essa funo de fato existe, ento

    possvel dizer que os pontos pertencentes a esses grupos so linearmente

    separveis. A discriminao feita determinando o conjunto timo de

    pesos para as variveis independentes de tal maneira que se maximize a

    varincia entre os grupos em relao varincia dentro dos grupos. Uma

    das maneiras mais simples de se obter uma funo linear discriminante

    (MASSART et al., 1997, KOWALSKI et al., 1984, BRUNS e FAIGLE, 1985)

    ilustrada na Figura 1.8.

    Figura 1.8 Representao esquemtica da anlise discriminante linear. Os centros de gravidade (os asteriscos) dos grupos formados por crculos e quadrados so inicialmente determinados. Em seguida traa-se um plano de deciso eqidistante e perpendicular linha que une os centros de gravidade dos grupos, formando as regies R1 e R2. Se um ponto qualquer estiver presente na regio R1, o mesmo classificado como pertencente ao grupo 1. Caso contrrio, obrigatoriamente pertencer categoria 2.

  • 23 INTRODUO

    Vale salientar que em LDA, se a amostra apresentar erro do Tipo I,

    conseqentemente ocorrer erro do Tipo II (BRUNS e FAIGLE, 1985).

    Diferentemente do SIMCA, mtodo de classificao consolidado para

    trabalhar em altas dimenses, a LDA limita-se ao uso de dados com baixa

    dimensionalidade. Neste contexto, torna-se necessrio o emprego de

    mtodos de seleo de variveis que so teis para aumentar a

    capacidade preditiva dos modelos, eliminar variveis no informativas e

    reter aquelas que, provavelmente, resultam em uma boa exatido.

    1.7.6 Seleo de variveis

    As tcnicas quimiomtricas tradicionalmente utilizadas no contexto

    da classificao possibilitam trabalhar com todo o conjunto de dados,

    reduzindo sua dimensionalidade, por meio de fatorao, para facilitar a

    visualizao e interpretao destes dados. Por exemplo, PCA transforma

    as variveis e distribui os objetos em novos sistemas de eixos ortogonais

    em funo da maior varincia dos dados (MASSART et al., 1997, BEEBE et

    al., 1998), permitindo a utilizao destes com bastante eficincia em

    tcnicas como SIMCA e LDA (DIAZ et al., 2005, PONTES et al., 2006,

    KEMSLEY, 1996). A principal desvantagem deste tipo de compresso de

    dados a dificuldade de interpretaes fsicas ou qumicas do sistema,

    tendo em vista que trabalha no domnio das variveis transformadas.

    Vrios algoritmos tm sido propostos para uma seleo mais conveniente

    de variveis (GESTAL et al., 2004, WU e MASSART, 1997, STEEL et al.,

    2000), entre eles, pode-se destacar o SPA desenvolvido por ARAJO et al.

    (2001) para seleo de variveis, no contexto da calibrao multivariada,

    aplicada aos modelos de regresso linear mltipla (Multiple Linear

    Regression MLR).

    1.7.7 Algoritmo das projees sucessivas (SPA)

    A essncia do SPA consiste em buscar um conjunto pequeno e

    representativo de variveis com nfase na minimizao de colinearidade

    entre elas. Desta maneira, torna-se possvel usar modelos MLR que,

  • 24 INTRODUO

    embora relativamente simples e de fcil interpretao, so severamente

    afetados por problemas de colinearidade (ARAJO et al., 2001).

    Os fundamentos tericos, bem como os detalhes da rotina

    operacional do SPA tm sido extensivamente tratados em outros trabalhos

    (ARAJO et al., 2001, GALVO et al., 2001b, PONTES et al., 2005,

    DANTAS-FILHO et al., 2004, HONORATO et al., 2005). Apesar disto,

    importante a apresentao de um exemplo ilustrativo no contexto da

    voltametria.

    Considere um conjunto J = 5 variveis voltamtricas: X1 = 400 mV;

    X2 = 450 mV; X3 = 500 mV; X4 = 550 mV e X5 = 600 mV para a

    determinao de dois analitos (A=2) usando trs amostras de calibrao

    (Xcal = 3). Ento, a rotina de operaes do algoritmo para a seleo das

    variveis realizada na seguinte ordem:

    1) Para o clculo das projees, usa-se como vetor (K(0)) de partida aquele que

    possuir a maior norma. Contudo, os demais vetores so posteriormente testados e

    aqueles mais ortogonais sero incorporados para a formao de cadeias de

    variveis candidatas (Figura 1.9).

    Figura 1.9 Exemplo do funcionamento do SPA para selecionar potenciais a partir de cinco variveis voltamtricas: a) Projees no plano ortogonal a X3; b) Viso espacial dos vetores no plano horizontal.

    2) O programa gera J x [(Xcal - A) + 1] cadeias (K(0), N), onde K(0) pode variar de

    1 at J, e N, nmero de variveis em cada cadeia, pode variar de A at Xcal. Para

    este exemplo: sero geradas 5 x [(3 2) + 1] = 10 cadeias, ou seja, todas as

    possveis combinaes entre K(0) e N:

    X1,2 X2,2 X3,2 X4,2 X5,2

    X1,3 X2,3 X3,3 X4,3 X5,3

  • 25 INTRODUO

    3) A primeira cadeia de variveis a ser formada composta pelo vetor de partida,

    neste caso X3 (500 mV), alm das duas variveis mais ortogonais X1 (400 mV) e

    X5 (600 mV).

    4) Para se determinar qual a melhor cadeia de variveis, faz-se uma regresso por

    MLR para cada uma delas, empregando-se como matriz X as intensidades de

    corrente da cadeia de variveis e como matriz Y as concentraes dos dois

    analitos avaliados. Realiza-se, atravs da Equao (1.5), o clculo do erro

    quadrtico mdio de previso (RMSEP) de amostras de um conjunto de teste para

    cada um dos modelos MLR construdos.

    !"# $ %& '& &( (1.5) Em que & e '& so os valores de referncia e previsto pelo modelo, de um parmetro de interesse. O algoritmo escolhe a cadeia de variveis cujo modelo

    MLR resulta no menor RMSEP.

    Vale salientar que o nmero de variveis selecionadas em cada

    cadeia, N, limitado pela quantidade de amostras do conjunto de

    calibrao para evitar problemas com a inverso de matrizes nos modelos

    MLR.

    1.7.8 SPA no contexto da classificao

    Recentemente, PONTES et al. (2005) adaptaram o SPA para o

    contexto dos mtodos de reconhecimento de padro. Neste caso, a

    informao da modelagem consiste nos dados das respostas instrumentais

    (matriz X) e um vetor contendo o ndice de classe para cada amostra.

    Como se trata de classificao, os valores de referncia dos y parmetros

    no so disponveis para processar a estatstica do RMSEP que a funo

    de custo adotada pelo SPA-MLR para a seleo das variveis (DANTAS-

    FILHO et al., 2004). Portanto, quando um subconjunto de variveis sob

    avaliao empregado, a funo de custo adotada o risco mdio ) de uma classificao incorreta, sendo este um critrio da Anlise

    Discriminante Linear.

    Esta funo calculada no conjunto de teste como:

  • 26 INTRODUO

    ) *+%,-*+-( (1.6) Onde *+ o nmero de amostras do conjunto de teste e ,- risco de uma classificao incorreta da *th validao da amostra .-. Logo, ,- definido como:

    ,- /.-, 2-3452672- /.-, 26 (1.7) Na Equao (1.7), o numerador /.-, 2- o quadrado da distncia

    de Mahalanobis entre a amostra .- (de ndice de classe 2-) e a amostra mdia, 2-, de sua classe verdadeira. Esta distncia calculada como:

    /.-, 2- .-, 2-% .- 2-89 (1.8) Em que 2- e correspondem amostra mdia e a covarincia, respectivamente, e so calculadas com os dados das amostras do

    conjunto de calibrao. O denominador corresponde ao quadrado da

    distncia de Mahalanobis entre a amostra .- e o centro da classe incorreta mais prxima. Idealmente, ,- o maior valor possvel, de modo a validar melhor os limites entre as classes. Portanto, ser escolhida a cadeia de

    variveis que resultar no menor risco mdio ) de uma classificao incorreta.

    1.7.9 Quimiometria aplicada voltametria

    HERRERO e ORTIZ (1999) avaliaram os aspectos qualitativos e

    quantitativos da aplicao do algoritmo gentico (Genetic Algorithm GA)

    no contexto da seleo de variveis em alguns exemplos envolvendo

    dados polarogrficos e voltamtricos. Em todos os casos o desempenho

    dos modelos PLS com e sem seleo de variveis pelo GA foi avaliada em

    funo da mdia do erro absoluto relativo para a previso. No exemplo da

  • 27 INTRODUO

    determinao de benzaldedo por DPP, a mdia do erro absoluto relativo

    para o modelo PLS foi de 2,10% enquanto para o modelo GA-PLS foi de

    1,85%.

    BESSANT e SAINI (1999) desenvolveram uma metodologia para

    determinao simultnea de glicose, frutose e etanol empregando como

    eletrodo de trabalho um eletrodo de platina no modificado, a voltametria

    de escada de pulso duplo (Dual Pulse Staircase Voltammetry DPSV) e

    ANN para a calibrao multivariada. Os voltamogramas utilizados so

    resultados da subtrao da resposta do branco, que o voltamograma do

    prprio eletrlito suporte (NaOH 0,1 mol L-1). Posteriormente, os

    mesmos autores (BESSANT e SAINI, 2000) testaram estes dados

    empregando outras tcnicas de calibrao multivariada, tais como: MLR,

    regresso por componentes principais (Principal Component Regression

    PCR) e PLS. Ainda assim, os resultados no superaram os obtidos com

    ANN em virtude do carter no linear do etanol e de sua interao com

    frutose.

    PALACIOS-SANTANDER et al. (2003) aliaram a tcnica ANN a

    mtodos de reduo de dimensionalidade matricial, tais como:

    transformadas de Fourier (Fourier Transform FT) e Wavelet (Wavelet

    Transform WT) para resolver problemas de sobreposio de sinais

    eletroqumicos obtidos pela voltametria de pulso diferencial (Diferential

    Pulse Voltammetry DPV). Neste estudo, utilizou-se um eletrodo de gota

    pendente de mercrio (Hanging Mercury Drop Electrode HMDE) para a

    determinao simultnea dos ons Tl+ e Pb2+. Este mtodo foi comparado

    com as tcnicas PLS e PCR e, baseando-se na raiz do erro mdio

    quadrtico (Root Mean Square Error RMSE), estabeleceu-se que o

    modelo proposto mais eficiente. Paralelamente, COCCHI et al. (2003)

    utilizaram esta mesma metodologia e os mesmos analitos para comparar

    os resultados da calibrao multivariada empregando PLS, MLR e ANN aos

    coeficientes wavelets gerados aps a compresso dos voltamogramas. Os

    melhores resultados foram obtidos por MLR.

  • 28 INTRODUO

    A DPV tambm foi utilizada para elaborao de um mtodo capaz de

    determinar pesticidas organofosforados, utilizando HMDE e quimiometria.

    Devido alta sobreposio dos voltamogramas para estes compostos, a

    quantificao foi realizada empregando comparativamente as tcnicas

    PCR, PLS, mnimos quadrticos clssicos (Classical Least Square CLS),

    Kalman filter (KF) e ANN. Recuperao satisfatria para um conjunto de

    amostras sintticas foi obtida por ANN (NI et al., 2004).

    NI et al. (2001a) desenvolveram um mtodo utilizando HMDE e DPV

    para determinao simultnea de nitrobenzeno, 2-, 3-, 4-nitrofenol e 2,4-

    dinitrofenol com PLS, PCR e CLS. Foram alcanados erros relativos de

    previso de 10 % para PLS e PCR e 38% para CLS. Posteriormente,

    esta metodologia foi utilizada na construo de um modelo de calibrao

    multivariada para quatro pesticidas (carbamatos) incluindo, desta vez, o

    uso de ANN. Neste caso, o erro relativo de previso foi de 5,6% (NI et al.,

    2005). Este mesmo grupo utilizou eletrodo de carbono vtreo e as tcnicas

    mais comuns de voltametria e calibrao multivariada para determinao

    simultnea dos antioxidantes hidroxianisol butilado, hidroxi-tolueno

    butilado, propil galato e tert-butilhidroquinona (NI et al., 2000) e, dos

    antipsicticos cloridrato de clorpromazina e cloridrato de prometazina (NI

    et al., 2001b).

    cido nalidxico (antibacteriano) e seu principal metablico, cido 7-

    hidroximetilnalidxico, foram determinados em urina aplicando ANN e PLS

    aos voltamogramas obtidos por meio da polarografia de pulso diferencial

    (Diferential Pulse Polarography DPP), SWV e mtodos de corrente

    contnua (Sampled DC). Modelo PCR foi construdo e os escores obtidos

    foram utilizados para o treinamento das redes neurais. Os melhores

    resultados foram obtidos com ANN e DPP (GUIBERTEAU et al., 2004).

    CUKROWSKA et al. (2001) desenvolveram um mtodo para

    determinao simultnea de adenina e citosina utilizando padres destes

    analitos para elaborar modelos de calibrao multivariada empregando

    ANN. Voltametria de varredura linear (Linear Sweep Voltammetry LSV)

    e DPP foram testadas neste trabalho. A tcnica LSV apresentou melhores

  • 29 INTRODUO

    resultados, com erros absolutos de 3,7% e 5,2% para adenina e citosina,

    respectivamente.

    BARTHUS et al. (2005) aplicaram o mtodo PLS aos dados obtidos

    por SWV com eletrodo de carbono vtreo para misturas sintticas de cido

    ascrbico e b-nicotinamida adenina dinucleotdeo (NADH). Foram obtidos

    erros relativos mximos de 1,7% e 2,1% para NADH e cido ascrbico,

    respectivamente.

    PLS foi utilizado para quantificao de benzaldedo empregando a

    DPP com intuito de determinar a capacidade de discriminao. Neste caso,

    a calibrao univariada no pde ser aplicada devido ao aumento

    caracterstico do pico com a concentrao e as leves oscilaes do pH

    (SANZ et al., 2001).

    SAURINA et al. (2000) utilizaram um eletrodo de grafite-metacrilato,

    voltametria cclica (Ciclic Voltammetry CV) e as tcnicas quimiomtricas

    PCR e PLS para a determinao simultnea de aminocidos oxidveis

    (cistena, tirosina e triptofano). Desvios-padro relativos de 10% foram

    obtidos para as previses de cistena e triptofano e 18% para tirosina.

    Posteriormente, este mesmo grupo (SAURINA et al., 2004) desenvolveu

    uma nova metodologia utilizando DPV e um eletrodo de platina para a

    quantificao dos mesmos aminocidos. Esta estratgia apresentou um

    bom compromisso entre sensibilidade, seletividade e reprodutibilidade

    para estes analitos.

    Vinhos, cervejas, cafs, leites e sucos de fruta foram analisados por

    SWV com eletrodo de platina, que passou por um procedimento de

    limpeza por ultra-som antes de cada amostra. PCA e HCA foram utilizadas

    como tcnicas de reconhecimento de padro. Para o emprego de

    calibrao multivariada por PCR e PLS, uma amostra de suco de laranja foi

    diluda sucessivas vezes para construir os conjuntos de amostras

    necessrios. Os resultados em termos de RMSEP foram de 4,0% e 5,4%

    para PCR e PLS, respectivamente (SCHREYER e MIKKELSEN, 2000).

    Um arranjo de microeletrodos de carbono vtreo reticulado foi

    desenvolvido para a quantificao e classificao de bactrias utilizando

  • 30 INTRODUO

    voltametria de pulso normal (Normal Pulse Voltammetry NPV), SIMCA e

    PLS. Resultados aceitveis foram obtidos em calibrao multivariada

    transformando a varivel dependente em escala logartmica (log(1+yi)) e

    auto-escalonando todas as variveis independentes. (Berrettoni et al.,

    2004a, Berrettoni et al., 2004b).

    Um algoritmo para resoluo de curva multivariada (Multivariate

    Curve Resolution MCR) por mnimos quadrados alternados (Alternating

    Least Square ALS) tem sido utilizado com bastante eficincia para

    resoluo de sobreposio de picos em sinais eletroanalticos, inclusive,

    servindo como ferramenta para investigar o processo eletroqumico

    envolvido (ESTEBAN et al., 2000, CRUZ et al., 2000, DAZ-CRUZ et al.,

    2000, DAZ-CRUZ et al., 20001, FERNNDEZ et al., 2001, DAZ-CRUZ et

    al., 2002, ANTUNES et al., 2002, CRUZ et al., 2002).

    DIAZ et al. (2004) avaliaram as tcnicas DPV, SWV e DC com intuito

    de desenvolver uma metodologia para a determinao de tocoferol

    (vitamina E) em amostras de leos vegetais (canola, milho, soja e oliva)

    usando PLS. Utilizou-se um eletrodo de carbono vtreo e o voltamograma

    do branco (eletrlito de suporte) foi registrado antes de cada medida. Os

    melhores resultados foram alcanados pelo PLS-DPV, quando comparados

    com os obtidos por cromatografia.

    ESTEBAN et al. (2006a e b) publicaram duas revises reunindo o

    uso de dados voltamtricos com diferentes aplicaes quimiomtricas:

    otimizao e planejamento experimental, preparao e transformao de

    dados para tratamentos posteriores, explorao de dados, classificao de

    amostras e calibrao multivariada.

    Recentemente, JAKUBOWSKA (2007) desenvolveu uma nova funo

    wavelet me dedicada ao pr-processamento de voltamogramas levando

    em considerao seu perfil, bem como as necessidades bsicas para a

    anlise desse tipo de sinal como: reduo de rudo experimental, correo

    da linha de base e sobreposio de picos.

    A reviso literria at aqui realizada permitiu observar que poucos

    trabalhos tm sido desenvolvidos explorando a unio de tcnicas

  • 31 INTRODUO

    voltamtricas com a anlise multivariada, sobretudo no contexto dos

    mtodos de classificao de amostras. Diante disto, a SWV, tcnica

    voltamtrica caracterizada por apresentar uma boa sensibilidade em alta

    velocidade de varredura, combinada com mtodos de reconhecimento de

    padro e seleo de variveis pode ser uma alternativa promissora para

    classificao de diferentes tipos de leos vegetais refinados.

  • CAPTULO II OBJETIVOS

  • 33 OBJETIVOS

    2.1 Objetivo Geral

    Neste trabalho proposto um mtodo rpido, simples e barato para

    a classificao e fiscalizao de leos vegetais comestveis quanto ao

    prazo de validade, que combina a voltametria de onda quadrada (SWV)

    com anlise discriminante linear (LDA) associada ao algoritmo das

    projees sucessivas (SPA) para a seleo de variveis.

    2.1.1 Objetivos Especficos:

    i) Utilizar tcnicas de planejamento experimental para otimizar as condies de

    analise em SWV.

    ii) Utilizar a combinao da SWV, cuja instrumentao e manuteno no so

    dispendiosas quando comparadas s demais tcnicas freqentemente

    adotadas (cromatografia e espectroscopia), com mtodos de reconhecimento

    de padro supervisionado (SIMCA e LDA) e seleo de variveis.

    iii) Aplicar PCA a partir dos voltamogramas visando discriminao de amostras

    de leos vegetais refinados no vencidos e vencidos.

    iv) Elaborar e validar modelos SWV-SIMCA para classificao de leos vegetais

    no vencidos e vencidos.

    v) Utilizar a LDA com seleo prvia de variveis (potenciais voltamtricos) pelo

    SPA para a classificao de leos vegetais refinados.

    vi) Comparar o desempenho dos modelos SWV-SIMCA e SWV-LDA-SPA em

    termos do nmero de erros de classificao.

  • CAPTULO III EXPERIMENTAL

  • 35 EXPERIMENTAL

    3.1 Amostras

    Cento e quatorze amostras de leos vegetais refinados, de

    diferentes lotes e fabricantes, foram adquiridas em estabelecimentos

    comerciais da cidade de Joo Pessoa, Paraba. Dessas amostras, 66 so

    aqui denominadas no vencidas, pois foram adquiridas no perodo de

    agosto a setembro de 2006 e estavam dentro do prazo de validade, e 48

    so amostras com o prazo de validade expirado (PVE), que foram

    adquiridas em 2004. As classes e a quantidade de amostras analisadas

    so detalhadas na Tabela 3.1.

    Tabela 3.1 Classes e quantidade de amostras de leos vegetais analisados.

    Classes de leo Nmero de Amostras

    Canola 15

    Girassol 16

    Milho 17

    Soja 18

    PVE 48

    3.2 Diviso do conjunto de amostras

    Antes da construo dos modelos quimiomtricos, as amostras de

    cada uma das classes de leos delineadas na Tabela 3.1 foram divididas

    em trs conjuntos (treinamento, teste e previso) utilizando o algoritmo

    KS (KENNARD e STONE, 1969), que usado para extrair um conjunto

    representativo de amostras de um determinado conjunto de dados.

    Inicialmente, o KS foi aplicado de modo a gerar o conjunto de treinamento

    de cada classe. Em seguida, o KS foi aplicado s amostras remanescente

    de cada classe de modo a gerar o conjunto de teste. As amostras

    restantes foram ento usadas como amostras do conjunto de previso. O

    nmero de amostras de cada classe e de cada conjunto mostrado na

    Tabela 3.2.

  • 36 EXPERIMENTAL

    Tabela 3.2 Nmero de amostras de treinamento, teste e previso selecionadas pelo KS para as cinco classes de leos vegetais.

    Classes Conjuntos

    Treinamento Teste Previso

    Canola 9 3 3

    Girassol 10 3 3

    Milho 10 3 4

    Soja 10 4 4

    PVE 20 10 18

    3.3 Materiais e reagentes

    Todos os reagentes utilizados foram de grau analtico P.A. e so

    listados abaixo juntamente com os materiais:

    lcool etlico absoluto (ISOFAR);

    Hidrxido de sdio (MERCK KGaA);

    cido actico (MERCK KGaA);

    gua deionizada Milli-Q (Millipore Inc);

    Pipetas automticas de 2-20 e 20-200 L (Eppendorf) e de 1,00-10,0 mL (VOLAC

    John Poulten Ltd);

    Ponteiras (Eppendorf) descartveis de polietileno;

    Vidraria;

    Tubos de polipropileno de 1,5 mL (Eppendorf).

    3.4 Equipamentos

    A parte experimental foi realizada empregando a SWV em um

    estudo eletroanaltico que possibilitasse a elaborao e avaliao de

    modelos quimiomtricos de classificao de leos vegetais refinados. As

    medidas foram realizadas em um potenciostato/galvanostato AutoLab

    Type II da Eco Chemie acoplado ao mdulo polarogrfico 663 VA Stand

    da Metrohm (Figura 3.1), equipado com um eletrodo de referncia de

    Ag/AgCl KCl (3.0 mol L-1) e um fio de platina como contra eletrodo. O

    eletrodo de trabalho foi escolhido entre os eletrodos de disco de platina e

  • de ouro e, todos

    planejamentos experimentais.

    Figura 3.1 Potenciostato/Galvanostato AUTOLABVA Stand da cela eletroqumica

    3.5 Procedimento a

    Os parmetros da voltametria de onda quadrada

    os estudos preliminares foram os seguintes:

    Potencial - tempo de condicionamento: 0,7 V

    Potencial - tempo de deposio:

    Tempo de equilbrio:

    Freqncia: 20 Hz;

    Janela de varredura de potencial:

    platina VS. Ag/AgCl);

    Incremento de potencial: 5 mV;

    Amplitude de pulso: 25 mV.

    Voltamogramas registrados em triplicata.

    Os dois primeiros

    no trabalho realizado por

    um mtodo para determinao eletroqumica multivariada de

    alifticos com eletrodo de disco de platina, NaOH como eletrlito de

    suporte e adaptaram

    trabalho.

    de ouro e, todos os parmetros foram otimizados com base em

    planejamentos experimentais.

    Potenciostato/Galvanostato AUTOLAB Type II esquerda e o mdulo da cela eletroqumica direita.

    a