7
/ I / ,I s.

s. · 2017-08-14 · transmissores. Por este motivo, a obtenção de um diagnóstico precoce é de suma importância, para evitar apropagação. ... utilizada em estudos de plantas,

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: s. · 2017-08-14 · transmissores. Por este motivo, a obtenção de um diagnóstico precoce é de suma importância, para evitar apropagação. ... utilizada em estudos de plantas,

/

I

/,I

s.

Page 2: s. · 2017-08-14 · transmissores. Por este motivo, a obtenção de um diagnóstico precoce é de suma importância, para evitar apropagação. ... utilizada em estudos de plantas,

Extração de Características para Geração de um Classificador para DetecçãoPrecoce do HLB em Citros

Diego Carlos Pereira da Silva': Patrícia Pedroso Estevam Ribeiro"; Lúcio André de Castro Jorge/;Maria Stela Veludo de Paiva '; Débora Marcondes Milori2; Danilo Scavacini Gonçalves", Camila

Miranda Carvalho"; André Leonardo Venânico"; Fabíola Manhas Verbi Pereira"

1- Mestrando, Escola de Engenharia de São Carlos - Universidade de São Paulo - USP, Depto. deEngenharia Elétrica, São Carlos-SP, [email protected].

2- Pesquisador, Embrapa Instrumentação Agropecuária, São Carlos - SP, [email protected] Professora, Escola de Engenharia de São Carlos - Universidade de São Paulo - USP, Depto. de

Engenharia Elétrica, São Carlos-SP, [email protected] Bolsista, Embrapa Instrumentação Agropecuária, São Carlos -SP.

Abstract

Greening ar Huanglongbing (HLB) is one of the mostserious threats for citrus production worldwide. SãoPaulo, Brazil is the most important citrus producers and,is making effortsfor citrus diseases contrai. The bacterialpathogen is, mainly, under suppression contrai, appliedby eradication of symptomatic and no-symptomaticplants. ln this way, the detection and diagnostic of therelated symptoms and, consequently, the eradication ofthe citrus trees are essentialfor higher economicallossesprevention. In this way, our goal is to develop a newoptical and data mining technique, applied in fieldconditions, to detect citrus diseases using a fluorescenceimaging system. lt was used a system that perform imageof the chlorophyll fZuorescence in the whole leaf lt wascollected images of 3 leavesfrom 120 differentgreenhouse rootstocks. lt has obtained fZuorescenceimages and spectral data of citrus healthy leaves andcontaminated leaves with HLB. ln this paper it wasdescribed a new method to extract attributes by datafusion, carrying out different analysis to try todiscriminate between safe and diseased leafs. The resultsshow that the method is very accurate for HLB ultimatelydetection.

1 IntroduçãoO Greening, também chamado deHuanglongbing (HLB) (BOVÉ, 2006), é umadas mais graves doenças dos citros presentesnos pomares do Brasil desde 2004(FUNDECITRUS, 2009). Causada pela bactériaCandidatus Liberibacter SSP é transmitida peloinseto psilídeo Diaphorina citri, que ao sealimentar de plantas doentes transmite a mesmaàs demais plantas. A única forma de prevenção

consiste na erradicação pela raiz das plantascontaminadas, associada ao controle dos insetostransmissores. Por este motivo, a obtenção deum diagnóstico precoce é de suma importância,para evitar a propagação.Dentre os métodos existentes atualmente paradiagnosticar a doença, pode-se citar: o métodode inspeção visual e a análise do PCR(Polymerase Chain Reaction) (INNIS et al,1990). A inspeção visual só permite atuar depoisde muitos meses e, enquanto isto, a doençaprolifera-se. Por outro lado, o PCR seria maisrápido, porém, o custo da análise toma-oproibitivo de ser aplicado em escala necessáriapara o controle.Algumas técnicas rápidas de detecção compotencial de uso em larga escala começam a seraplicadas no estudo de doenças de plantas.Dentre elas se destaca a espectroscopia defluorescência, utilizada em estudos de plantas,onde o sintoma ainda não é visível, tais como: autilização para o diagnóstico do Cancro Cítrico(UNS, 2009), Morte Súbita dos Citros (MSC) eDeclínio (ZAGHI, 2008). Também em frutos,Kim et al. (2008) desenvolveram um sistema deimagens pela utilização da técnica deFluorescência Induzida por Laser. Além do usoda espectroscopia, o uso de imagem tem sidocada vez maior no estudo de doenças dediferentes culturas. Dentre eles, destaca-se autilização de técnicas de análise de texturaaplicadas nas imagens no visível (PYDIPATI et

Page 3: s. · 2017-08-14 · transmissores. Por este motivo, a obtenção de um diagnóstico precoce é de suma importância, para evitar apropagação. ... utilizada em estudos de plantas,

al., 2006). Lenk et al. (2007) demonstraram autilização das técnicas de fluorescência erefletância de imagens por meio da análise dasfolhas das plantas. Kim et al. (2007)desenvolveram um sistema on-line paraobtenção de imagens hiperespectrais no visível eno infravermelho próximo, aplicado naclassificação de maçãs.Neste artigo pretende-se apresentar osresultados da aplicação de técnicas de seleçãode características para geração declassificadores automáticos para detecção doGreening, a partir de dados e imagens defluorescência.Para a extração destas características e geraçãodo classificador foram aplicadas algumastécnicas de Mineração de Dados descritas porWitten e Frank (2005).Foram utilizadas neste artigo as técnicas deFluorescência Induzida por Laser (FIL) eImagens de Fluorescência Induzida porRadiação Ultravioleta. Foram gerados trêsvetores de características, sendo o primeirocomposto pelos espectros obtidos com aaplicação da técnica FIL, o segundo compostopelos histogramas dos modelos de cores RGB,HSL e CIE La*b* obtidos das imagens defluorescência e o terceiro com estatísticas decada um dos histogramas de cores, ou seja, amédia, mediana e coeficiente de curtose.

2 Aquisição de DadosO Grupo Fischer (Grupo Fischer, 2010)disponibilizou à EMBRAPA InstrumentaçãoAgropecuária 120 mudas de Valência com oporta-enxerto Swingle. Estas mudas foramplantadas no Instituto Agronômico de Campinas(IAC), localizado na cidade de Cordeirópolis -SP.Todas as mudas foram podadas para que ocrescimento vegetativo fosse estimulado e paraque a idade das folhas fosse uniformizada.Desse total de 120 mudas, 60 delas foraminoculadas com o vírus da tristeza (MEISSNERFILHO et al., 2002) e com a bactériaCandidatus Liberibacter asiaticus, por meio do

método de enxertia de borbulha, e as restantesforam inoculadas apenas com o vírus da tristeza.Para esse experimento a coleta das folhas foipadronizada.Durante 28 semanas foram coletadas amostras eanalisadas pelas diferentes técnicas descritas aseguir. Para o armazenamento das informaçõesobtidas neste experimento foi desenvolvido pelaEMBRAP A Instrumentação Agropecuária osoftware Greening, em linguagem C# (VisualC# Developer Center, 2010) e as informaçõesforam armazenadas num Banco de DadosPostgreSQL (PostgreSQL, 2010).

2.1 Imagem de Fluorescência Induzida porRadiação UltravioletaAs imagens de fluorescência induzida por luzultravioleta foram obtidas por meio de umacâmera digital (AxioCamMRc5, Zeiss,Gõttingen/Alemanha) de 5M pixels de resoluçãoacoplada a um estereomicroscópio (Lumar.v lZ,Zeiss, Gõttingen/ Alemanha). Para excitar afluorescência foi utilizada uma lâmpada a vaporde mercúrio, sendo selecionado apenas ocomprimento de onda da radiação ultravioleta.As folhas ficaram expostas por um período de545 ms. As imagens obtidas foram aumentadasem 30 vezes com o auxílio de uma lupa epossuem as seguintes dimensões: 1292 (largura)x 968 (altura) pixels com 24 bits de intensidade(PEREIRA e MILORI, 2009). Na Figura 1 podeser observada a imagem típica de fluorescênciapara uma folha da estufa, sendo a imagem defluorescência (a) de uma planta sadia e (b) deuma planta inoculada com a bactéria, após ummês.

2.2 Fluorescência Induzida por Laser(FI L)A Fluorescência Induzida por Laser utiliza aradiação de um laser para obter o espectro defluorescência das folhas de citros analisadas(ZAGHI, 2008).

Page 4: s. · 2017-08-14 · transmissores. Por este motivo, a obtenção de um diagnóstico precoce é de suma importância, para evitar apropagação. ... utilizada em estudos de plantas,

(a) (b)

Figura 1 - (a) Imagem de fluorescência típica deuma planta saudável e (b) de uma plantainoculada após um mês.

Neste artigo, foram analisados os comprimentosde onda da faixa de 575 nm até 1.000 nm. NaFigura 2 apresentam-se os espectros típicos para(a) uma planta saudável e (b) uma plantainoculada após o primeiro mês.

&p.ctroFll-~-~

t-,-,-.- - - ~ - - ,~ ,~ ,-c___

EspKIrOl'Il-~-~

t-,-,-.- - - ~ - IlOO ,_ 1100 1200 1:1OC1_.-(a) (b)

Figura 2 - (a) Espectro de fluorescência típicode uma planta saudável e (b) de uma plantainoculada após 1mês.

3 ExtraçãoClassificadores

de características

3.1 Vetor de CaracterísticasO primeiro vetor de características é formadopor todos os componentes do espectro FIL,normalizado e com ofl-set zerado. Para tanto,todos os valores foram subtraídos do mínimo edivididos pelo máximo valor.O segundo vetor de características foi formadopelas componentes de cor das imagens deFluorescência Induzida por Laser, no modelo decores RGB, HSL e CIE La*b*. Da mesmaforma foram normalizados pelos valoresmáximos de cada componente, visando a suanormalização entre O e 1.O terceiro vetor de características foi compostodos valores da média, da mediana e docoeficiente de curtose, calculados dos

histogramas f(x) de cada componente de cor,conforme as equações (1), (2) e (3).

Média = ~ .I%:o [(xa (1)

Na equação (1) n corresponde ao número detonalidades do histograma f(x). A mediana dohistograma f(x) é a medida de tendência centrale é calculada pela equação (2).

Mediana = [C+1) (2)

2

A curtose é a medida de dispersão quecaracteriza o "achatamento" da curva da funçãode distribuição de cores e é calculada por (3):

Curtose = !l.~- 3 (3)a

Sendo f.J4 o quarto momento central, calculadoda equação dos momentos estatísticos (4) e o odesvio padrão, onde X o valor médio de X.

~k = ~Ir=l ( Xi - i)k [(Xi) (4)

e

3.2 Seleção de Características eClassificadoresA API (Application Programming lnterface) dotoolbox WEKA (WEKA, 2010) foi utilizadaneste trabalho para a extração das característicase geração do classificador. Para tanto énecessária a utilização da combinação de umalgoritmo de seleção de características, e de umalgoritmo de busca, que é responsável porrealizar a busca no subconjunto decaracterísticas gerado pela execução dosalgoritmos de seleção de características.Neste artigo foram avaliados os seguintesalgoritmos para serem utilizados na extração dascaracterísticas desses vetores: Seleção decaracterísticas baseados na correlação(Correlation-based Feature Selection - CFS) decaracterísticas e busca gulosa (GreedyStepwise); Componentes Principais (PCA) eRanker. O algoritmo CFS utilizado para seleçãode características, avalia o valor de umsubconjunto de características, considerando ahabilidade preditiva de cada característicapermitindo certo grau de redundância entre estas(HALL, 1998); o algoritmo Greedy Stepwise faz

Page 5: s. · 2017-08-14 · transmissores. Por este motivo, a obtenção de um diagnóstico precoce é de suma importância, para evitar apropagação. ... utilizada em estudos de plantas,

uma busca gulosa nos subconjuntos de cadaespaço de atributos (WITTEN e FRANK, 2005).O algoritmo PCA é utilizado para seleção decaracterísticas, transformando os dados para umnovo espaço de atributos (WITTEN e FRANK,2005) segundo a maior variância dos dados; oalgoritmo Ranker conjuntamente com a PCApara realizar a busca de componentes principaismais relevantes (WITTEN e FRANK, 2005).Para a classificação desses vetores foramavaliados os algoritmos: o C4.5 e o Mu/ti LayerPerceptron (MLP). O algoritmo C4.5 é baseadoem uma árvore de decisão cuja a estruturaexpressa os dados de maneira rápida e eficiente(QUINLAN, 1993). O algoritmo MLP ébaseado em uma rede neural do tipo MultiLayerPerceptron com algoritmo backpropagation(WITTEN e FRANK, 2005).O C4.5 foi escolhido pela simplicidade e o MLPpela facilidade de implementar em dispositivoembarcado para uso direto em campo.

4. RESULTADOS E DISCUSSÃOForam realizados três experimentos, usando: a)só o vetor de atributos FIL; b) somente oscomponentes de cor a partir dos histogramasRGB, HSL e CIE La*b*; e c) componentes decor fundidos com dados do espectro defluorescência. Em cada um dos casos foramfeitos estudos das características selecionadas ea melhor classificação encontrada pelosdiferentes métodos testados.

4.1 Resultados com as Imagens deFlurescência a partir do UltravioletaOs padrões de fluorescência para as mudasinoculadas com o HLB se alteram ao longo dotempo, como pode ser observado na Figura 3,durante os oito meses do experimento.No caso de mudas sadias observa-se que avariação é menor, permanecendo mais presenteo padrão mais avermelhado. Um exemplo distoé apresentado na Figura 4, onde sãoevidenciados os histogramas HSL no início efinal do experimento, para uma planta com HLBe sadia.

A fluorescência também sofre alteração com odesenvolvimento da muda, apesar da retiradadas mudas seguir um protocolo que garante arealização das análises sempre em folhas demesmo estágio de desenvolvimento.Após a extração do vetor de características comas componentes RGB, HSL e La*b*, foramaplicados os métodos de seleção decaracterísticas e de classificação descritos noitem 3.2. Os resultados são apresentados naFigura 5.O método J48 implementa o algoritmo C4.5.Este método juntamente com o MLP foiaplicado diretamente no vetor com todas ascaracterísticas de cor. Posteriormente, foramselecionadas as características pelos métodos dePCA com Ranker e CFS com Greedy. Ascaracterísticas então selecionadas foramutilizadas na geração do classificador.

(d) mar/lO

Figura 3: Variação da fluorescência percebidana imagem ao longo do tempo, para uma plantainoculada com o HLB.

Durante a classificação foram utilizados 10foldscom validação cruzada, aplicados a todas asimagens coletadas. Os resultados apresentadosna Figura 5 mostram a porcentagem de acertoutilizando cada técnica.

Page 6: s. · 2017-08-14 · transmissores. Por este motivo, a obtenção de um diagnóstico precoce é de suma importância, para evitar apropagação. ... utilizada em estudos de plantas,

11

1j li

(c) Sadia em mar/09 (d) Sadia em nov/09

Figura 4: Imagens de fluorescência ehistogramas HSL da muda com HLB (a) emmar/09 e (b) em nov/09 e da muda sadia (c) emmar/09 e (d) em nov/09.

Para a rede MLP foi utilizada a taxa deaprendizagem de 0.3, a taxa do momentum foide 0.2, número máximo de épocas detreinamento foi limitado a 500 e a função deativação é a sigmóide.Em geral, os resultados com MLP melhoram aprecisão. Também a seleção de característicasresulta em classificação superior e utilizammenos componentes tornando o processo maisrápido. A detecção só acontece com precisão apartir do quinto mês.

"I~8C

I~~~--------------------.f~ ",~o. #~ o~f;Jo" ~d-\<9> bt?~ _I',I:J ." .•\"'~ ~ ••.~

Data da coleta

1 J48-+-J48+ PCA+ Ranker__ J48. CFS + Gree!tt-+-MlP I

Figura 5: Classificações corretas a partir dasimagens de fluorescência.

4.2 Resultados com os Espectros FILOs padrões de fluorescência para as mudasinoculadas com o HLB se alteram ao longo dotempo, como pode ser observado na Figura 6.No exemplo apresentado são evidenciados os

espectros FIL no uncio e no final doexperimento, para uma planta com HLB e outrasadia. Percebe-se que os padrões do sinal entre650nm e 750nm são alterados de uma plantasadia para uma planta com HLB.

1 .:DI 'u:

1_'I •

Ir"!111(1;»,

t;_.-.... .'.-

•••• tot7al ••••• 'QI;'.,

(b) Sadia - nov/09(a) Sadia - juV09 -_ ...I! •••1,-

1:')000II ,••

-. .Q ., lõIt l'Ot •• tIO '1.OiI .>:;ç ,* ')(10

(c) HLB - jul/09 (d) HLB - nov/09Figura 6: Espectro de fluorescência FIL damuda sadia (a) em mar/09 e (b) em nov/09, ecom HLB (c) em mar/09 e (d) em nov/09.

Aplicando os algoritmos de classificação eseleção de características, foram obtidos osresultados de classificação da Figura 7.Nitidamente consegue-se uma detecção maiorlogo no primeiro mês.

Data da coleta

I-+- J48 ..148 + PCA + Ranker -.-..148 + CFS + Greedy I

Figura 7: Gráfico com classificações corretas apartir dos espectros FIL.

4.2 Resultados com a fusão dos EspectrosFIL, histogramas imagens de Fluorescência eparâmetros estatísticos

Fazendo-se a seleção de características com osdados FIL, os histogramas RGB, HSI e LAB, eos parâmetros curtose, média e mediana dos

Page 7: s. · 2017-08-14 · transmissores. Por este motivo, a obtenção de um diagnóstico precoce é de suma importância, para evitar apropagação. ... utilizada em estudos de plantas,

histogramas, obteve-seapresentada na Figura 8.

a classificação

Data da coleta

J48 -..148 + PCA + Ranker - ..148+ CFS + Greedy --- MLP I

Figura 8: Gráfico com classificações corretas apartir dos espectros FIL.

Segundo a Figura 8 pode-se observar que asclassificações com a fusão melhoraram osresultados quando comparados somente com asimagens. No caso do FIL, os classificadoresconseguiram resultados superiores.

ConclusõesEm geral, um número grande de atributostambém leva a um erro maior na classificação.Porém, o ideal seria fazer uma busca exaustivano espaço de estados para selecionar a melhorcombinação de atributos para gerar oclassificador, o que é inviável dependendo donúmero de combinações existentes.Este trabalho apresenta um resultado inédito declassificador aplicado numa área de extremaimportância, apresentando acertos muitosuperiores com o que é conseguido hoje nasinspeções visuais, ou seja, abaixo de 50%.Também, este trabalho serviu de referência parageração de um sistema classificador com baseem imagens e FIL para aplicação direta nocampo.

AgradecimentosAgradecemos o apoio financeiro do CNPq(processo 578627/2008-6), fornecimento demudas da empresa Fischer S.A., estufa e conduçãodo experimento pelo Centro de Citricultura doIAC.

Referências BibliográficasBOVÉ, J. M. Huanglongbing: a destructive, newly-emerging,ccntury-old disease of citrus. Journal of Plant Pathology, Pisa,v. 88, p.7-37, 2006.

FUNDECITRUS. Manual Técnico do Greening 2009.Disponível em:<http://www.fundecitrus.com.br/lmageBank/PageFlip/pageflip.aspx?idPagc=143>. Acesso em: 29 abro2010.Grupo Fischcr. Disponível em:<http://www.citrosuco.com.br/fischer/fischerlsites/fischer/portai~polhomelindex.html>. Acesso em: 30 abr. 2010.HALL, M. A. Correlation-based Feature Subset Selection forMachine Leaming. Hamilton, New Zcaland, 1998.KlM, M. S.; CHEN, Y.; CHO, B.; CHAO, K.; YANG, C.;LEFCOURT, D. C. Hyperspectral reflectance and fluorescenceline-scan imaging for online defcct .and fecal contaminationinspection of apples. SpringerLink, New York, v. I, p. 151-159,2007.KIM, M. S.; CHO, B.; LEFCOURT A. M.; CHEN, Y.; KANG,S. Multispectral fluoresccnce lifetime imaging of fecescontaminated apples by time-rcsolved laser-inducedfluorcsccnce imaging system with tunable excitationwavelcngths. Applied Optics, New York, v,47, p. 10,2008.INNIS, M. A.; GELFAND, D. H.; SNINSKY, J. J.; WHITE, T.J. (cds.), PCR Protocols: A guide to mcthods and applications,Academic Press: San Diego, 1990.LENK, S.; CHAERLE, L.; PFÜNDEL, E. E.; LANGSDORF,G.; HAGENBEEK, D.; LlCHTENTHALER, H. K.;STRAETEN, D. V. D.; BUSCHMANN, C. Multispectralfluorescence and rcflcctancc imaging at the lcaf levei and itspossible applications. Journal of Experimental Botany,Oxford, v. 58, p. 807-814,2007.LINS, E. C. C. C. Espectroscopia da Fluorescência naCitricultura. São Carlos: Instituto de física de São Carlos,Universidade de São Paulo, 2009.

ME1SSNER FILHO, P. E.; SOARES FILHO, W. dos S.;VELAME, K. V. C.; DlAMANTlNO, E. P.; DlAMANTINO,M. S. A. S. Reação de porta-enxertos híbridos ao Citrus tristezavirus. Fitopatologia Brasileira, Brasília, v. 27, p. 312-315,2002.PEREIRA, F. M. V.; MILORI, D. M. B. P. Identificação devariedades genéticas de laranja doce por meio de imagens defluorescência. São Carlos, SP: Embrapa InstrumcntaçãoAgropecuária, 2009. 17 p. (Embrapa lnstrumentaçãoAgropecuária. Boletim de Pesquisa e Desenvolvimento, 27).PostgreSQL. Disponível em: <httpt//www.postgresql.org/ >.Acesso em: 29 abr. 2010.PYDIPATI, R.; BURKS, T. F.; LEE, W. S. Identification ofcitrus disease using color tcxture featurcs and discriminantanalysis. Computers and electronics in agriculture, NewYork, v. 52, p. 49-59, 2006.QUINLAN, J. R. C4.5: Programs for Machine Leaming.Morgan Kaufmann Publishers, San Mateo, CA, 1993.Visual C# Developcr Ccnter. Disponível em:<http://msdn.microsoft.comlpt-br/vcsharp/default.aspx>. Acessoem: 29 abr 20 IO.WEKA. Disponível em: <http://www.cs.waikato.ac.nz/mllwckal >. Acesso em: 29 abr.2010.WITTEN, 1. H.; FRANK, E. Data mining : practical machincleaming tools and techniques. 2 ed. San Francisco, 2005.ZAGHI, A. F. Diagnóstico de Doenças de Citros Utilizandoespectroscopia de fluorescência, São Carlos: Instituto dequímica de São Carlos, Universidade de São Paulo, 2008.