*Companhia Hidro Elétrica do São Francisco - CHESF, Av. General San Martin,
1450 – Anexo 6, Bloco B, Sala 202 – CEP 50761-901 – Recife – PE - BRASIL
Telefone: (0xx81) 3229-4806 – Fax: 0xx81) 3229-4742 – e-mail: [email protected]
SISTEMA DE APOIO À OPERAÇÃO DA CHESF, BASEADO EM EXTRAÇÃO DE INFORMAÇÃO
ANTÔNIO SÉRGIO DE ARAÚJO*
MARCUS COSTA SAMPAIO**
PEDRO SÉRGIO NICOLETTI**
CHESF UFCG UFCG Brasil Brasil Brasil
CLÁUDIO DE SOUZA BAPTISTA**
ULRICH SCHIEL**
UFCG UFCG Brasil Brasil
Resumo – Este trabalho apresenta a experiência da CHESF e da UFCG com o desenvolvimento de
um Sistema de Apoio à Decisão da Operação da CHESF (SAD), o qual tem como objetivo a extração,
dinamicamente e em tempo real, de informação relevante de documentos normativos técnicos operacionais,
de modo a permitir que os operadores possam operar o sistema elétrico de potência com exatidão e dentro
de prazos estabelecidos. Extração de Informação é uma tecnologia de recuperação de informação cujo
objetivo é automaticamente extrair informação estruturada (isto é, descrita por meta dados) de informação
não estruturada (sem meta dados). Considerando que as instruções normativas e operacionais são
documentos não estruturados, e que a informação deve ser apresentada aos operadores de maneira
estruturada, mínima e completa, a extração de informação surge então como uma abordagem indicada para
a minimização e a completude da informação para a operação da CHESF. É importante também destacar
que o SAD, além de apoiar os operadores em tempo real, disponibiliza serviços de biblioteca digital on-line
de instruções normativas e operacionais. O artigo detalha os conceitos básicos de extração de informação,
suas extensões face à problemática da CHESF, a arquitetura do SAD, e um protótipo do mesmo.
Palavras chave: Mineração de Texto – Recuperação de Informação – Banco de Dados – Sistema
Inteligente – Operação de Sistema Elétrico de Potência.
1 INTRODUÇÃO
A Supervisão e Controle do sistema elétrico da CHESF tem a complexa tarefa de supervisão, coordenação,
comando e execução de manobras de equipamentos. Para isso, os operadores dispõem de documentação
técnica sobre o sistema elétrico, facilitando assim a liberação e normalização de equipamentos em condições
programadas ou de ocorrência. Entretanto, dois dos principais problemas encontrados pelos operadores são:
(1) uma quantidade grande de instruções normativas e operacionais, que incluem os detalhes sobre os
procedimentos que devem ser seguidos em caso de ocorrência; e (2) muita informação não essencial: estima-
se que a parte diretamente relacionada com ocorrência não represente mais do que 30% dos documentos, em
média. Como os operadores devem decidir em tempo real, eles não dispõem de tempo para manualmente
extrair a informação mínima e completa em relação a uma dada ocorrência, ou a um conjunto de ocorrências,
como um blackout. Some-se a isso a instabilidade dos documentos: eles sofrem revisões constantemente.
XIII ERIAC DÉCIMO TERCER ENCUENTRO
REGIONAL IBEROAMERICANO DE CIGRÉ
24 al 28 de mayo de 2009
Comité de Estudio C2 - Operación y Control de Sistemas
XIII/PI-C2 -10 Puerto Iguazú
Argentina
2
Este trabalho apresenta a experiência da CHESF e da UFCG com o desenvolvimento de um Sistema de
Apoio à Decisão da Operação da CHESF (SAD) [1], o qual tem como objetivo a extração, dinamicamente e
em tempo real, de informação relevante de documentos normativos técnicos operacionais, de modo a
permitir que os operadores possam operar o sistema elétrico de potência com exatidão e dentro de prazos
estabelecidos.
A extração de informação, no SAD, segue a moderna tendência de recuperação de informação que se baseia
na constatação de que, em muitos casos, nem todas as partes de um documento são relevantes a uma
consulta. Assim, é desejável recuperar somente partes ou passagens relevantes do documento, filtrando a
informação irrelevante. Isto é tão mais necessário quanto mais longo for o documento. Em termos mais
técnicos, Extração de Informação (EI) [2] é uma tecnologia de recuperação de informação cujo objetivo é
automaticamente extrair informação semi-estruturada (isto é, descrita por meta dados) de informação não
estruturada (sem meta dados). Considerando que as instruções normativas e operacionais são documentos
não estruturados, e que suas partes relevantes devem ser descritas por meta dados, a EI surge então como a
tecnologia indicada para a minimização e completude da informação para a operação da CHESF.
O SAD, além de ser um sistema em tempo real de extração de informação de instruções normativas e
operacionais, funciona também como uma biblioteca digital on-line, capaz de recuperar documentos
relevantes integrais de consultas por palavras chave, como também extrair somente partes relevantes de
documentos relevantes, dependendo do grau de refinamento da consulta.
Seja o seguinte cenário. Dada uma ocorrência, o SAD em tempo real recupera a informação mínima e
completa para apoiar o operador na recomposição do sistema elétrico. Tipicamente, a informação pode ser
apresentada em três níveis: informação sobre equipamentos de modo geral, informação genérica relativa à
tensão de operação do equipamento envolvido, e informação específica sobre o equipamento envolvido.
Havendo ainda dúvidas do operador, o mesmo, posteriormente, pode conferir certos tópicos adicionais de
informação, em quaisquer dos três níveis de detalhe, com a ajuda de um flexível serviço de busca a
documentos da biblioteca digital on-line.
Nas seções seguintes, o artigo detalha a problemática de extração de informação da CHESF, a arquitetura do
SAD, e um protótipo já em funcionamento. As conclusões encerram o artigo.
2 O PROBLEMA DE EXTRAÇÃO DE INFORMAÇÃO DA CHESF
Nesta seção, discutem-se os principais tipos de ocorrência no sistema elétrico e, para cada ocorrência, as
fontes de dados e a informação relevante aos operadores do sistema.
As fontes de dados são instruções normativas e operacionais, sob a forma de documentos MS Word. Trata-se
de documentos não estruturados, no sentido de que não são explicitamente descritos por meta dados, muito
embora implicitamente eles sejam divididos em título, seções e subseções em vários níveis. A exploração
dessa divisão é valiosa para a extração de informação relevante.
O sistema elétrico, como um todo, deve obedecer aos padrões legais preestabelecidos para o fornecimento de
energia elétrica aos consumidores, na quantidade necessária e qualidade requerida. Como conseqüência de
fatores internos e externos, é impossível tornar este sistema imune à perturbações, defeitos e falhas diversas.
Estas condições anormais, também chamadas de ocorrências, resultam em interrupções em função de
desarmes (desenergizações) automáticos não programados de um ou vários equipamentos do sistema
elétrico, por medida de proteção. Os esquemas de proteção (constituídos de relés) são planejados para
receberem informações das grandezas elétricas do sistema em tempo real, de forma a atuarem sempre que
condições anormais ocorram. Cada ocorrência exige procedimentos gerais e específicos imediatos da parte
dos operadores. Uma primeira série de procedimentos visa a religar (reenergizar) o(s) equipamento(s)
desligado(s). Ocorre que, às vezes, o religamento não é bem sucedido, e requer novos procedimentos para
recompor o sistema sem o(s) equipamento(s) temporariamente perdidos(s).
Os equipamentos que podem ser desligados pela proteção são dos seguintes tipos, em ordem alfabética:
banco de capacitores, barramento, compensador, gerador, linha de transmissão, reator, transformador; e
ainda, blackout de subestação ou sistema.
De modo geral, a informação a ser recuperada para uma ocorrência no sistema elétrico deve seguir o padrão:
• Informação genérica relacionada à ocorrência (uma instrução normativa de reenergização de
equipamentos)
3
• Informação genérica relacionada à ocorrência na tensão apropriada (instruções operacionais de
controle de tensão em barramentos, de energização de trafos, e de religamento de linhas de
transmissão, entre outras instruções operacionais)
• Informação específica relacionada de alguma forma ao tratamento da ocorrência (instruções
operacionais de reenergização de subestações ou sistema, instruções operacionais de preparação para
manobras de equipamentos diversos, roteiros de manobra, entre outras instruções operacionais)
• Informação específica relacionada com procedimentos de contingência para a ocorrência (instruções
operacionais de limites operacionais de equipamentos, de perda de trafo, gerador, barramento, de
transferência de disjuntores, de religamento, de operação de subestação, de transferência de carga
entre subestações, entre outras instruções operacionais).
Para ilustrar o problema de extração de informação, considere-se o desarme, acompanhado de perda, de um
barramento de 230 KV de uma subestação. Indicam-se a seguir as informações que devem ser recuperadas
para este tipo de ocorrência / contingência:
Desarme de Barramento de 230 KV da Subestação Bongi
Fonte de Dados Informação Relevante
IN-OP.01.006: Reenergização de Equipamentos e Linhas de
Transmissão (Genérico)
seções 3.5, 4 (parcial), 5, 5.1, 5.2, 6, 6.1, 6.2,
6.3, 7 (parcial), 7.1, 7.2 e 7.3
IO-L.01: Controle de Tensão nos Barramentos de 69 e 138
KV das Subestações, 45º. Edição (Genérico)
seções 2, 3 e 4
IO-BGI.01: Reenergização da Subestação Bongi, 32º. Edição
(Específico)
seções 2, 3 e 4
IO-L.11: Perda do 04BP da Subestação Bongi (Específico) seções 3 e 4
Muitos documentos sofrem revisões constantemente, como é o caso das instruções operacionais IO-L.01 e
IO-BGI.01 do exemplo, que se encontram em suas 45º. e 32º. edições, respectivamente. Esta alta volatilidade
dos documentos, de um modo geral, pode introduzir enganos nos operadores, que terminam por perder a
noção de qual é a revisão em vigor, com as ações equivocadas que podem advir da escolha errada.
Há que destacar que (sub)seção não é necessariamente a granularidade da informação extraída. Voltando ao
exemplo, somente partes das seções 4 e 7, da instrução normativa IN-OP.01.006, são relevantes.
Finalmente, os operadores e engenheiros podem querer consultar instruções normativas e operacionais, fora
de uma situação de ocorrência, para tirar dúvidas, ou com fins de auto-estudo e reciclagem. A consulta pode
ser tanto a documentos integrais, como também a somente partes relevantes deles.
3 ARQUITETURA DO SAD
Levando em conta a problemática de extração de informação da CHESF, discutida na seção anterior, o SAD
foi concebido conforme a arquitetura mostrada na Fig. 1.
4
Fig. 1. Arquitetura do SAD
O SAD é constituído de três módulos principais: Máquina de Busca, SAD-TR e SAD-RI. Passa-se a
descrever cada um dos módulos.
3.1 Máquina de Busca
A máquina de busca recupera informação textual de um banco de dados constituído de documentos semi-
estruturados (formato XML). Os documentos são automática e duplamente indexados: por palavras chave, e
por expressões de caminho XML (XML path expressions). A análise dos documentos compreende uma
variedade de estratégias como consulta por palavras chave, consulta por contexto e casamento de padrões, e
consulta por conteúdo de expressões de caminho.
Em consultas por expressões de caminho, o conteúdo recuperado pode ser uma (sub)seção inteira de um
documento, ou somente parte(s) dela: não há restrição quanto à granularidade das marcações (tags) XML.
Tecnicamente, o banco de documentos e os índices que o acompanha compõem um ODS (Operational Data
Store) [3], significando uma visão materializada de fontes de documentos textuais. A materialização e os
índices são uma garantia do potencial desempenho adequado do ODS.
Os processos clientes da máquina de busca são os módulos SAD-TR e SAD-RI, descritos adiante, o primeiro
requerendo um alto desempenho do ODS.
Para a carga do banco de documentos XML, um sub-módulo, wrapper, merece especial atenção.
3.1.1 Wrapper
Tecnicamente, um wrapper [4] é um software que transforma um documento não estruturado, ou
parcialmente semi-estruturado, em um documento semi-estruturado bem-formado, ou completamente semi-
estruturado.
No contexto do SAD, um documento parcialmente semi-estruturado é uma instrução normativa (IN) ou
instrução operacional (IO) em que suas partes relevantes, por tipo de equipamento, são anotadas (ou
marcadas) por técnicos da CHESF. Na Fig. 1, isto é indicado por Documentos Não Estruturados, Anotados.
Para ilustrar, um trecho relevante, de qualquer tamanho, de um documento relevante a barramento (BR) é
anotado com <BR> trecho relevante a barramento </BR>. De forma equivalente, trechos relevantes a trafo
(TR) e linha de transmissão (LT) são anotados com <TR> ... </TR> e <LT> ... </LT>, respectivamente, e
assim para os outros tipos de equipamento. Quando um trecho é relevante a qualquer tipo de equipamento
(Geral), ele é anotado com <G> </G>.
Por sua vez, um documento não estruturado é ou do tipo IOP Instrução de Operação de Proteção , ou
do tipo IOE Instrução de Operação de Equipamento. Diferentemente de INs e IOs, IOPs e IOEs ou são
recuperados em sua inteireza, ou a extração é por (sub)seção.
5
O wrapper então automaticamente transforma um documento IN ou OP com as anotações dos técnicos da
CHESF (tags externos) em um documento XML bem-formado, ou dizendo de outro modo, embutindo no
documento uma estrutura em árvore completa e consistente de tags XML. Mais precisamente, a árvore é
completada com tags automáticos internos (seções e subseções).
No caso de IOPs e IOEs, os tags são somente internos.
Dado um documento IN ou IO, em média o número de tags externos é pequeno, quando comparado ao
número de seus tags internos. Tal constatação permite reduzir substancialmente os custos de atualização de
documentos (recorde-se que os documentos sofrem revisões constantemente, invalidando as edições
anteriores). Quando uma nova edição surge, isso pode implicar em atualização de alguns tags externos,
porém o grosso do trabalho, que é a atualização / geração consistente dos tags internos, é automática, ou a
cargo do wrapper.
3.2 SAD-TR
O módulo SAD-TR (Tempo Real) viabiliza uma interface Web e orientada a eventos, com o objetivo de
apoiar, em tempo real, os operadores em suas decisões face a situações de ocorrência na rede elétrica. O
SAD-TR se alimenta do sistema SmartAlarms [5] e do módulo Máquina de Busca (ver Fig. 1).
SmartAlarms transforma alarmes do SAGE (Sistema Aberto de Gerenciamento de Energia) que é o Sistema
de Controle e Supervisão da rede elétrica da CHESF , e emite diagnósticos sobre a rede elétrica (na
realidade, desarmes) que são causas raiz de ocorrências no sistema elétrico. Esses diagnósticos são captados
pelo módulo SAD-TR, o qual, por intermédio da máquina de busca, recupera para os operadores a
informação mínima e completa sobre os procedimentos a adotar para cada diagnóstico. Desta forma, os dois
sistemas, SmartAlarms e SAD, se complementam, o primeiro emitindo diagnósticos, e o segundo apoiando
somente com informação relevante as ações decorrentes dos operadores.
Detalhes da interface do SAD-TR ((Tempo Real) Diagnósticos & Extratos, Fig. 1) são mostrados na seção 4,
sobre o protótipo desenvolvido.
O SAD-TR também engloba as funções do SAD-RI (ver seção 3.3), e será instalado nos centros regionais de
operação da CHESF, que dispõem de SAGE e do SmartAlarms.
3.3 SAD-RI
O módulo SAD-RI (Recuperação de Informação) pode ser entendido primariamente como um sistema de
recuperação de informação tradicional, em que documentos inteiros (na verdade, links), por ordem de
relevância (ranking de documentos), respondendo a consultas a INs, IOs, IOPs e IOEs seja por palavras
chave, seja por contexto e casamento de padrões.
Mas ele é ao mesmo tempo um avançado sistema de recuperação de informação, no sentido de que permite
também a extração somente de partes relevantes de documentos relevantes, respondendo a consultas por
expressões de caminho XML. No caso de INs e IOs, a granularidade das partes relevantes é definida de dois
modos: (1) pelo pessoal da CHESF, através de seus tags externos; e (2) (sub)seção. No que diz respeito a
IOPs e IOEs, a granularidade é sempre (sub)seção (tags internos).
O SAD-RI será disponibilizado tanto nos centros regionais de operação da CHESF, quanto em suas
subestações e usinas; nestas últimas, os documentos são somente dos tipos IOP e IOE.
Por falta de espaço, a interface do SAD-RI ((On-line) Extratos & Documentos, Fig. 1) não é mostrada neste
artigo.
4 PROTÓTIPO DO SAD
Um protótipo do SAD-TR foi desenvolvido, como prova de conceitos de sua interface Web e orientada a
evento. Dois instantâneos da interface são respectivamente mostrados nas figuras 2 e 3.
6
Fig. 2. Interface Web e Orientada a Evento do SAD-TR
No lado esquerdo da tela (Fig. 2), ficam enfileirados, por ordem de chegada, os diagnósticos que chegam do
SmartAlarms (ver Fig. 1). Quando um operador ‘clica’ em um diagnóstico aparecem, no lado direito, os
documentos relevantes ao diagnóstico, com os documentos genéricos (ver seção 2) tendo precedência sobre
os documentos específicos do diagnóstico. Para cada documento, são exibidos links para o documento
inteiro, e para (sub)seções que contêm partes relevantes, inclusive (sub)seções inteiras. Quando uma seção
não é relevante, mas tem (sub)seções no todo ou em parte relevantes, o título da (sub)seção ainda aparece,
sem link, apenas para indicar o contexto da informação a ser extraída.
Na tela da Fig. 2, o diagnóstico do SmartAlarms é um desarme de um barramento da subestação de Currais
Novos II (03B2-CRD). Ao ‘clicar’ no diagnóstico, aparecem os documentos IN-OP.01.006, IO-L.01,
IOCRD01, nesta ordem, além de outros documentos, depois do IOCRD01. Na tela, aparecem todos os links e
contextos da IN-OP.01.006, todos os links da IO-L.01, e parte dos links e contextos da IO-CRD.01. Os
demais links e contextos da IO-CRD.01, e os dos documentos restantes relativos ao diagnóstico são
visualizados via a barra vertical de rolagem da tela.
Seja a seção 3. CONCEITOS, do documento IN-OP.01.006. Como é um link, significa que uma parte ou
toda a seção é relevante ao diagnóstico. Diferentemente, a seção 5. PROCEDIMENTOS GERAIS ... não tem
link, e portanto ela em si não tem nada de relevante, mas é o contexto de suas duas subseções 5.1 e 5.2, estas
sim relevantes, no todo ou em parte.
7
Fig. 3. Extração de Informação com o SAD-TR
Na Fig. 3, é mostrado o que acontece quando o operador ‘clica’ duas vezes no link 8. PROCEDIMENTOS
PARA REENERGIZAÇÃO DE LINHAS E ALIMENTADORES, do documento IN-OP.01.006: os trechos
da seção 8 que são relevantes ao diagnóstico do barramento 03B2-CRD são visualizados. Se agora o link for
‘clicado’ uma vez, a informação relevante ou a expansão do link é contraída, voltando, por exemplo, ao
instantâneo da Fig. 2.
Ainda com relação à Fig. 2, quando o operador ‘clica’ no título de um documento ou no seu código, uma
janela se abre para a visualização do documento inteiro, em formato pdf. Se ele ‘clicar’, por exemplo, em IN-
OP.01.006, então é o documento do mesmo código que aparece em sua inteireza, em uma janela própria.
Observem-se também os botões Expandir e Contrair, no alto do instantâneo da Fig. 2: ao apertar o primeiro
botão, todos os links, de todos os documentos, são expandidos com a correspondente informação relevante;
ao apertar depois o botão Contrair, o instantâneo da Fig. 2 é restaurado.
Finalmente, o ícone ⊗ ao lado de um alerta (Fig. 2) permite, com um toque, que o diagnóstico seja removido,
junto com todos os documentos que lhe são relevantes.
5 CONCLUSÃO
À guisa de conclusão, o SAD configura-se como uma ferramenta poderosa, para auxiliar a Supervisão e
Controle do Sistema Elétrico de Potência da CHESF a analisar a liberação de equipamentos após-ocorrência
na rede elétrica, eliminando a necessidade de o operador ter que consultar, em tempo real, documentos
longos, variados e dispersos, temática e geograficamente.
O SAD é, a rigor, um sistema de recuperação e extração de informação que opera tanto em tempo real junto
à Supervisão e Controle da operação, como também sob a forma de uma biblioteca digital de documentos
8
como: instruções normativas e operacionais, instruções de operação de proteção, e instruções de operação de
equipamento.
Extração de Informação é uma tecnologia de recuperação de informação cujo objetivo é automaticamente
induzir informação semi-estruturada (isto é, descrita por meta dados) de informação não estruturada (sem
meta dados). A indução de informação semi-estruturada permite que a informação seja apresentada de
maneira estruturada, mínima e completa para a operação da CHESF poder atuar em tempo real, em caso de
ocorrências na rede elétrica. Extração de informação é portanto a tecnologia chave do módulo de tempo real
do SAD, SAD-TR.
Fora de situações de ocorrência e havendo dúvidas do operador, o mesmo, dispondo também do módulo on-
line do SAD, SAD-RI, pode conferir certos tópicos adicionais de informação, com a ajuda de um flexível
serviço de busca a documentos.
Em termos arquiteturais, o núcleo do SAD é uma máquina de busca a um banco de documentos semi-
estruturados, o que permite otimizar, de forma inteligente, o trabalho de recuperação e extração de
informação de fontes diversas de documentos, atendendo às demandas tanto do SAD-TR quanto do SAD-
RI. A interface do SAD-TR é Web e orientada a eventos. Eventos no contexto do SAD são diagnósticos de
ocorrências na rede elétrica, captados de outro sistema, o SmartAlarms.
6 REFERÊNCIAS
[1] Projeto ANEEL/CHESF/PAQTC-PB/UFCG/SAD - Sistema de Apoio à Decisão da Operação (SAD)
http://sad.dsc.ufcg.edu.br/pub/Main/ProjetoSAD/SAD-resumo.pdf (reservado), 2008.
[2] D. E. Appelt, D. J. Israel. Introduction to Information Extraction Technology. Tutorial preparado para a
conferência IJCAI-99, 1999.
[3] W. H. Inmon, C. Imhoff, G. Battas. Building the Operational Data Store. John Wiley & Sons, 1995.
[4] D. Kauchak, J. Smarr, C. Elkan. Sources of Success for Boosted Wrapper Induction. Journal of Machine
Learning Research 5 (2004), pp. 499-527.
[5] Antônio Sérgio Araújo, Maria do Socorro Cavalcanti, J. P. Sauvé, Marcus Costa Sampaio, J. C.
Figueiredo., Eloi Rocha Neto, Walfredo Cirne, Alexandre Duarte Nóbrega. Smart Alarms - Tratamento
inteligente de alarmes para centros de operação de sistema da CHESF. EletroEvolução (Rio de Janeiro),
v.44, 2006, pp.29-37.