Upload
donhan
View
217
Download
0
Embed Size (px)
Citation preview
UNIVERSIDADE DE TAUBATÉ Vaslei Gil Balmant
Acionamento a distância de circuitos eletropneumáticos por reconhecimento de voz
Taubaté – SP 2011
Vaslei Gil Balmant
Acionamento a distância de circuitos eletropneumáticos por reconhecimento de voz
Dissertação apresentada para obtenção do título de Mestre em Engenharia Mecânica do Departamento de Engenharia Mecânica da Universidade de Taubaté. Área de concentração: Automação Industrial. Orientador: Prof. Dr. José Rui Camargo
Taubaté – SP 2011
VASLEI GIL BALMANT
ACIONAMENTO A DISTÂNCIA DE CIRCUITOS ELETROPNEUMÁTICOS POR RECONHECIMENTO DE VOZ
Dissertação apresentada para obtenção do título de Mestre em Engenharia Mecânica do Departamento de Engenharia Mecânica da Universidade de Taubaté. Área de concentração: Automação Industrial.
Data: _____________________________ Resultado: _________________________
BANCA EXAMINADORA Prof. Dr. José Rui Camargo Universidade de Taubaté Assinatura: __________________________________________________________ Prof. Dr. Álvaro Manoel de Souza Soares Universidade de Taubaté Assinatura: __________________________________________________________ Prof. Dr. Edilson Alexandre Camargo ITA -Instituto Tecnológico de Aeronáutica Assinatura: __________________________________________________________
Dedico este trabalho aos meus pais,
Valmi Balmant e Angela Maria Silva Balmant.
AGRADECIMENTOS
Agradeço a Deus por ter-me proporcionado condições e determinação para
finalizar esse trabalho.
Agradeço a Deus por ter colocado ao meu lado pessoas que me ajudaram,
apoiaram e me incentivaram.
Dentre essas pessoas, meus agradecimentos em especial ao Professor Dr.
José Rui Camargo, por toda ajuda e orientação.
Tudo posso naquele que me fortalece.
Filipenses 4.13
RESUMO
Este trabalho tem como objetivo apresentar os passos iniciais para adequação
entre a tecnologia de reconhecimento de voz e uma tecnologia de automatização de
processos, mais especificamente, a eletropneumática, de forma que o comando do
sistema possa ser realizado através de uma comunicação (voz) à distância.
A implementação do sistema de reconhecimento de voz foi feita em um
circuito elétrico de controle, para que válvulas eletropneumáticas possam ser
acionadas à distância, visando oferecer uma nova opção de comando aos sistemas
de automatização no setor industrial.
Basicamente, os sinais dos comandos treinados pelo módulo de
reconhecimento de voz são enviados a um visualizador digital, onde são
interceptados por um circuito eletrônico, denominado, transmissor. O sinal
interceptado em paralelo é convertido em serial, onde é enviado por rádio freqüência
a outro circuito eletrônico, denominado, receptor. O sinal serial recebido pelo
receptor é novamente convertido em paralelo. Esses sinais (comandos) digitais irão
substituir os comandos musculares convencionais do circuito eletropneumático.
Como o circuito elétrico de controle e o módulo de reconhecimento de voz
possuem características funcionais específicas, há necessidade de realizar
adequações no circuito eletropneumático tradicional, afim de garantir que a
sequência de operações dos elementos de trabalhos sejam realizadas corretamente.
Tais adequações consistem basicamente em garantir que apenas os comandos pré-
determinados executem ações específicas, e que palavras não reconhecidas pelo
módulo, ou códigos de erros, não interfiram no projeto.
Para a avaliação do sistema foram realizados testes numa bancada de
simulação para circuitos eletropneumáticos, utilizando-se um módulo de
reconhecimento de voz para a emissão dos comandos.
Os resultados obtidos após a validação do projeto foram plenamente
satisfatórios.
Palavras-chave: Circuito eletropneumático. Reconhecimento de voz. Comando
a distância.
ABSTRACT
Remote Triggering of electro-pneumatic circuits by voice recognition
This work aims to present the initial steps to adequacy between voice
recognition technology and process automation technology, more specifically, the
electro-pneumatic, so that the control of the system can be achieved through a
remote kind of communication (voice).
The implementation of the recognition of voice system was made in a control
electrical circuit, so that the electro-pneumatic valves can be moved at a distance,
aiming to provide a new option to the automation systems in the industrial sector.
Basically, the signs of controls trained by voice recognition module are sent to
a digital display, in which an electronic circuit called transmitter intercepts them. The
signal intercepted in parallel is converted into serial, where it is sent by radio
frequency to another circuit mail, called receiver. The serial signal received by the
receiver is again converted into parallel. These signals (controls) will replace the
conventional muscle controls circuit of the electro-pneumatic circuit.
As the electrical control circuit and the voice recognition module have specific
functional characteristics, there is a need to carry out adaptations in the electro-
pneumatic traditional circuit, in order to ensure that the operation sequence of the
elements of work be carried out correctly. Such adaptations consist basically in
ensuring that only the pre-determined controls implement specific actions, but also
words not recognized by module, or codes of errors, so that they do not interfere in
the project.
Tests were performed in a simulative workbench for electro-pneumatic circuits,
using a voice recognition module for the control emission as the assessment of the
system.
The results obtained after validation of the project were fully satisfactory.
Key-words: electro-pneumatic circuit. Voice recognition. Remote comand.
LISTA DE FIGURAS
Figura 1.1 – Esquema básico do projeto
Figura 3.1 – Módulo de reconhecimento de voz – SR-07
Figura 3.2 – O circuito SR-07
Figura 3.3 – Diagrama de blocos simplificado do módulo SR-07
Figura 3.4 – Esquema do circuito de reconhecimento de voz SR-07
Figura 5.1 – Os módulos TXC1 e RXD1
Figura 5.2 – Circuito do módulo SR-07 (saída dos displays)
Figura 5.3 – Concepção de ligação elétrica para o circuito transmissor
Figura 5.4 – O circuito elétrico de alimentação do transmissor
Figura 5.5 – O circuito amplificador de sinal
Figura 5.6 – O circuito encoder paralelo/serial
Figura 5.7 – Concepção de ligação elétrica para o circuito receptor
Figura 5.8 – O circuito elétrico de alimentação do receptor
Figura 5.9 – O circuito decoder paralelo/serial
Figura 5.10 – O circuito de seleção digital
Figura 5.11 – (a) circuito transmissor; (b) circuito receptor
Figura 6.1 – Esquema de funcionamento do Silo Alimentador Automático
Figura 6.2 – Diagramas do método seqüencial
Figura 6.3 – Diagramação completa do método seqüencial
Figura 6.4 – Sistema eletropneumático do silo alimentador
Figura 6.5 – Circuito elétrico de controle do silo alimentador
Figura 7.1 – Acionamento de emergência no sistema eletropneumático
tradicional
Figura 7.2 – Adequação no acionamento de emergência do sistema
eletropneumático
Figura 7.3 – Acionamento e desacionamento do sistema de emergência
Figura 7.4 – Acionamento de partida do circuito elétrico de controle
tradicional
Figura 7.5 – Adequação no acionamento de partida do circuito elétrico de
controle
22
32
33
34
35
62
63
64
65
66
67
68
70
71
72
73
77
78
80
82
83
86
87
87
88
90
Figura 7.6 – Sistema eletropneumático do silo alimentador adequado ao
módulo SR-07
Figura 7.7 – Circuito elétrico de controle do silo alimentador adequado ao
módulo SR-07
Figura 7.8 – Bancada de simulação
91
91
93
LISTA DE GRÁFICOS
Gráfico 4.1 – Gráfico de desempenho em sistemas dependentes de
locutor
Gráfico 4.2 – Gráfico de desempenho em sistemas independentes de
locutor
Gráfico 4.3 – Gráfico comparativo entre os sistemas dependentes e
independentes de locutor
54
59
60
LISTA DE TABELAS
Tabela 3.1 – Resultados obtidos no reconhecimento de voz da primeira
simulação
Tabela 3.2 – Resultados obtidos no reconhecimento de voz da segunda
simulação
Tabela 3.3 – Resultados obtidos no reconhecimento de voz da terceira
simulação
Tabela 3.4 – Resultados obtidos no reconhecimento de voz da quarta
simulação
Tabela 4.1 – Descrição da base de dados treinada e testada pelo locutor
1, com ocorrência de coarticulação tipo A
Tabela 4.2 – Descrição da base de dados treinada e testada pelo locutor
2, com ocorrência de coarticulação tipo A
Tabela 4.3 – Descrição da base de dados treinada e testada pelo locutor
3, com ocorrência de coarticulação tipo B
Tabela 4.4 – Descrição da base de dados treinada e testada pelo locutor
4, com ocorrência de coarticulação tipo B
Tabela 4.5 – Descrição da base de dados treinada pelo locutor 1, e
testada aleatoriamente pelos locutores 2, 3 e 4, com ocorrência de
coarticulação tipo A
Tabela 4.6 – Descrição da base de dados treinada pelo locutor 2, e
testada aleatoriamente pelos locutores 1, 3 e 4, com ocorrência de
coarticulação tipo A
Tabela 4.7 – Descrição da base de dados treinada pelo locutor 3, e
testada aleatoriamente pelos locutores 1, 2 e 4, com ocorrência de
coarticulação tipo B
Tabela 4.8 – Descrição da base de dados treinada pelo locutor 4, e
testada aleatoriamente pelos locutores 1, 2 e 3, com ocorrência de
coarticulação tipo B
Tabela 5.1 – Tabela verdade
42
43
44
45
51
51
52
52
55
56
56
57
68
LISTA DE APÊNDICES
APÊNDICE A – SISTEMAS ELETROPNEUMÁTICOS
APÊNDICE B – LAYOUT DO CIRCUITO IMPRESSO (TRANSMISSOR)
APÊNDICE C – LAYOUT DO CIRCUITO IMPRESSO (RECEPTOR)
100
112
113
LISTA DE ANEXOS
ANEXO A – FOLHA DE ESPECIFICAÇÕES DO MÓDULO RX-D1
ANEXO B – FOLHA DE ESPECIFICAÇÕES DO MÓDULO TX-C1
114
116
LISTA DE SIGLAS
A+ Cilindro “A” avançado ou avançando
A- Cilindro “A” recuado ou recuando
a0 Sensor fim de curso (haste do cilindro “A” recuada)
a1 Sensor fim de curso (haste do cilindro “A” avançada)
B+ Cilindro “B” avançado ou avançando
B- Cilindro “B” recuado ou recuando
b0 Sensor fim de curso (haste do cilindro “B” recuada)
b1 Sensor fim de curso (haste do cilindro “B” avançada)
C+ Cilindro “C” avançado ou avançando
C- Cilindro “C” recuado ou recuando
c0 Sensor fim de curso (haste do cilindro “C” recuada)
c1 Sensor fim de curso (haste do cilindro “C” avançada)
CI Circuito Integrado
CLP Controlador Lógico Programável
COM Modelo de Objeto Componente
CPU Central Única de Processamento
CSR Reconhecimento de Fala Contínua
dB Decibels
DTW Ajuste Temporal Dinâmico
E Emergência
HMM Modelo Oculto de Markov
K Relé
K2 Relé 2
K3 Relé 3
K+ Bobina do relé ativada
K- Bobina do relé desativada
KNA Contato do relé (normalmente aberto)
KNF Contato do relé (normalmente fechado)
NA Normalmente aberta
NF Normalmente fechada
P Pressão
RF Rádio Frequência
SR-07 Reconhecedor de voz (modelo 07)
YA- Válvula solenóide (recuo do cilindro “A”)
YB+ Válvula solenóide (avanço do cilindro “B”)
YB- Válvula solenóide (recuo do cilindro “B”)
YC+ Válvula solenóide (avanço do cilindro “C”)
YE Válvula solenóide (acionamento de emergência)
SUMÁRIO
1. INTRODUÇÃO
1.1. Justificativa
1.2. Objetivo
1.3. Desenvolvimento do trabalho
1.4. Revisão de literatura
2. NOTAS HISTÓRICAS
2.1. Evolução dos sistemas de comunicações
2.2. Evolução dos sistemas de automatização eletropneumática
3. O MÓDULO DE RECONHECIMENTO DE VOZ
3.1. O circuito integrado de reconhecimento de voz HM2007
3.2. Categorias dos sistemas de reconhecimento de voz
3.2.1. Sistemas dependentes
3.2.2. Sistemas independentes
3.3. Estilos de reconhecimento
3.4. Treinamento de palavras para serem reconhecidas
3.5. Testando o reconhecimento das palavras treinadas
3.6. Apagando os dados da memória
3.7. Testando o módulo de reconhecimento de voz SR-07
3.7.1. Primeira simulação
3.7.2. Segunda simulação
3.7.3. Terceira simulação
3.7.4. Quarta simulação
3.8. Análise dos resultados do teste de reconhecimento de voz
19
19
20
20
23
27
27
29
32
35
36
37
37
38
39
39
40
40
42
42
43
44
45
3.8.1. Análise dos resultados obtidos pelo sistema dependente
de locutor
3.8.2. Análise dos resultados obtidos pelo sistema
independente de locutor
4. ANÁLISE DE DESEMPENHO DO MÓDULO DE
RECONHECIMENTO DE VOZ SR-07 COM IMPLEMENTAÇÃO DO
EFEITO DE COARTICULAÇÃO
4.1. Metodologia utilizada
4.2. Análise comparativa de sistemas dependentes de locutor
com ocorrência de coarticulação
4.3. Resultados do sistema dependente de locutor
4.4. Análise comparativa de sistemas independentes de locutor
com ocorrência de coarticulação
4.5. Resultados do sistema independente de locutor
4.6. Comparativo entre os sistemas dependentes e
independentes de locutor
5. O CIRCUITO ELÉTRICO
5.1. O método de transmissão
5.2. O transmissor
5.3. O circuito transmissor
5.3.1. O circuito de alimentação do transmissor
5.3.2. O circuito amplificador de sinal
5.3.3. O circuito encoder paralelo/serial
5.4. O receptor
5.5. O circuito receptor
46
46
48
49
50
53
55
57
60
61
61
62
64
65
65
66
67
69
5.5.1. O circuito de alimentação do receptor
5.5.2. O circuito decoder paralelo/serial
5.5.3. O circuito de seleção digital
5.6. Os circuitos “Transmissor” e “Receptor”
5.7. Simulando um ambiente de independência de locutor
6. DESENVOLVIMENTO DO CIRCUITO ELETROPNEUMÁTICO
6.1. Silo Alimentador Automático (de grãos)
6.2. Diagramas do método seqüencial
6.3. Equações de acionamento dos elementos de trabalho
6.4. Sistema eletropneumático
6.5. Circuito elétrico de controle
7. IMPLEMENTAÇÃO DO SISTEMA DE RECONHECIMENTO DE
VOZ NO CIRCUITO ELÉTRICO DE CONTROLE
7.1. Adequação do sistema de segurança (botão de emergência)
7.2. Adequação do sistema de início de ciclo (botão de início)
7.3. Adequação do circuito eletropneumático ao módulo de
reconhecimento de voz SR-07
7.4. Testes experimentais na bancada de simulação
8. COMENTÁRIOS E CONCLUSÕES
REFERÊNCIAS
APÊNDICE A – SISTEMAS ELETROPNEUMÁTICOS
APÊNDICE B – LAYOUT (CIRCUITO IMPRESSO TRANSMISSOR)
APÊNDICE C – LAYOUT (CIRCUITO IMPRESSO RECEPTOR)
ANEXO A – FOLHA DE ESPECIFICAÇÕES DO MÓDULO RX-D1
ANEXO B – FOLHA DE ESPECIFICAÇÕES DO MÓDULO TX-C1
69
70
72
73
74
76
76
77
79
81
82
84
85
88
90
92
95
98
100
112
113
114
116
19
CAPÍTULO 1: INTRODUÇÃO
1.1 Justificativa
Há algumas décadas atrás, o reconhecimento de voz era visto por muitos
apenas como obra de ficção científica, talvez como HAL - 9000, o cérebro eletrônico
que interagia com seu operador no filme: 2001, A space Odissey, dirigido por
Stanley Kubrick, em 1968, nos EUA.
Contudo, desde a década de 50, instituições de pesquisa analisam maneiras
para que a voz possa ser processada e interpretada por computadores. No entanto,
é a partir de meados da década de 90 que começam a surgir as primeiras
aplicações utilizando a tecnologia de reconhecimento de voz, sendo que, a cada
nova aplicação que surge, a consolida comercialmente.
Hoje em dia, essa forma de automatização possui inúmeras aplicações, em
especial, no setor de entretenimento e informação, como por exemplo, a discagem
ativada por voz, a checagem de e-mails via telefone ou celular, o acesso a agendas
e serviços bancários (ou quaisquer outros serviços que registrem e consultem
informações em base de dados).
Por outro lado, com relação ao setor industrial, há algumas décadas têm-se
utilizado tecnologias como a hidráulica, a pneumática, a eletropneumática e o CLP
em seus sistemas e processos de automatização. Para o acionamento e controle
desses sistemas são normalmente utilizados válvulas hidráulicas ou pneumáticas
com acionamentos musculares ou mecânicos, sinais elétricos em válvulas
eletromecânicas, além dos mais diversos tipos de sensores.
Embora não tenha ainda uma aplicação específica no setor industrial, esse
trabalho apresentou os passos iniciais para adequação entre a tecnologia de
reconhecimento de voz e uma tecnologia de automatização de processos, mais
especificamente, a eletropneumática, de forma que o controle do sistema possa ser
realizado através de comando de voz à distância. A comunicação envolve
20
implicitamente a informação transmitida de um ponto a outro por uma sucessão de
processos (Haykin, 2004).
Espera-se que, oportunamente, sistemas como o proposto nesse trabalho
possam ser utilizados no setor produtivo industrial, até mesmo por pessoas com
deficiências físicas, ou mesmo no controle de processos de alto risco com foco em
segurança.
1.2 Objetivo
Esse trabalho possui como objetivo principal a implementação e adequação
de um sistema de reconhecimento de voz num circuito elétrico de controle, para que
válvulas eletropneumáticas possam ser acionadas à distância, visando oferecer uma
nova opção de comando aos sistemas de automatização no setor industrial.
1.3 Desenvolvimento do trabalho
Para o desenvolvimento desse trabalho foram elaboradas quatro etapas: a
primeira etapa tratou de escolher e obter um módulo de reconhecimento de voz, que
foi responsável por capturar e interpretar os sons analógicos emitidos pelas cordas
vocais humanas e transformá-las em sinais elétricos digitais compreensíveis aos
circuitos eletrônicos. Nessa etapa ainda, foram realizadas centenas de testes com a
finalidade de avaliar o desempenho do módulo escolhido em diferentes ambientes
de trabalho. Além disso, apesar de serem muitos os fatores que interfiram nos
processos de captação e reconhecimento da voz, uma atenção muito especial foi
dada à verificação do limite da influência dos sons externos no desempenho do
sistema. Foram realizados testes em ambientes com maiores e menores oscilações
21
na amplitude das ondas sonoras, com variação específica de nível sonoro.
Finalmente, foram definidos os ambientes e as condições mais apropriadas para que
o percentual de acertos do módulo de reconhecimento de voz se mantivesse num
nível elevado e aceitável aos processos de automatização proposto.
A segunda etapa foi destinada ao desenvolvimento de dois circuitos
eletrônicos, sendo um transmissor e um receptor de rádio freqüência, permitindo que
os comandos fossem realizados à distância. Posteriormente, foi desenvolvido um
circuito eletropneumático convencional que atendesse ao processo de
automatização de um silo alimentador automático. Esse circuito foi muito importante
no tocante a servir como modelo de testes, bem como, utilizá-lo como ponto de
partida para que pudesse ser adequado às características do módulo de
reconhecimento de voz. Para obtenção do circuito eletropneumático foi utilizado o
método seqüencial, uma vez que, intuitivamente projetistas diferentes certamente
encontrariam soluções diferentes para o mesmo problema. Dessa forma, a escolha
do método seqüencial foi no intuito de padronizar a solução obtida por diferentes
projetistas, a partir das equações de acionamentos dos elementos de trabalho.
Na terceira etapa foi realizado todo o tratamento de adequação das
características do módulo de reconhecimento de voz ao circuito elétrico de controle
e ao sistema eletropneumático, sendo que, todas as modificações necessárias foram
criteriosamente analisadas e comentadas.
Na quarta etapa foram realizados testes experimentais, desde o treinamento
dos comandos isolados no módulo de reconhecimento de voz SR-07, até a
observação funcional da sequência de operações do circuito eletropneumático, afim
de que todo o projeto fosse validado. Todas as considerações finais foram
comentadas, dando ênfase à aplicabilidade do sistema proposto aos processos de
automatização industrial.
Esse trabalho conta ainda com um apêndice, destinado aos circuitos
eletropneumáticos, enfatizando em primeiro lugar a sua importância no cenário da
automação industrial, analisando sua estrutura lógica e verificando os principais
elementos que compõem esse circuito.
Na figura 1.1 está representado o esquema básico do projeto.
22
Figura 1.1 – Esquema básico do projeto
O microfone, o módulo de gravação de voz, o teclado, o visualizador digital e
a programação fazem parte do módulo de reconhecimento de voz.
O circuito transmissor (desenvolvido a partir do sinal de saída do módulo de
reconhecimento de voz) e o circuito receptor são descritos detalhadamente no
capítulo 5.
O circuito elétrico de controle, o sistema eletropneumático e as adequações
necessárias são descritas detalhadamente nos capítulos 6 e 7.
23
1.4 Revisão de literatura
Para a execução deste trabalho foram realizadas várias pesquisas. A seguir,
um resumo dos assuntos das principais obras consultadas:
DIAS (2000) utilizou uma técnica de normalização de locutor com o intuito de
avaliar um sistema de reconhecimento de fala de vocábulo flexível (um vocábulo
formado por qualquer palavra de um mesmo idioma e não correlacionado com a
base de dados utilizado no treinamento do sistema). A técnica de normalização de
locutor adotada foi a de escalonamento (“warping”) do eixo de freqüências, por
tratar-se de uma técnica que tem apresentado bons resultados na normalização do
trato vocal.
Fez uma introdução sobre os sistemas de reconhecimento de fala e suas
restrições, além de ter descrito os modelos ocultos de Markov (Hidden Markov
Models) e suas aplicações em reconhecimento de fala.
Descreveu a base de dados e o ambiente específico de simulações,
apresentou o sistema de reconhecimento de fala flexível utilizado, e descreveu as
etapas do processo, tais como, extração de parâmetros, treinamento e
reconhecimento.
Finalmente apresentou a avaliação do sistema de reconhecimento de fala
utilizando normalização de locutor, bem como, suas devidas conclusões.
FERREIRA (2007) apresentou uma proposta de execução de um circuito
eletropneumático, com a finalidade específica de monitorar a pressão de um atuador
pneumático num processo de furação, em função da variação da espessura de
chapas metálicas.
No circuito eletropneumático proposto, empregou a tecnologia CLP
(controlador lógico programável), controlando uma válvula reguladora de pressão, a
partir de um sinal de entrada de um sensor elétrico.
Concluiu que em aplicações industriais similares, o controle do sistema pode
ser administrado em função do reconhecimento do tipo de espessura de chapa,
sendo possível um ganho de produtividade.
24
LIMA et AL (2000) realizaram análises comparativas de diversos parâmetros
em sistemas de reconhecimento de voz para palavras isoladas, tanto em sistemas
dependentes de locutor, quanto em sistemas independentes de locutor.
Verificaram a influência de parâmetros como o tamanho do codebook, o
número de estados, o número de coeficientes cepstrais por segmento, o tamanho da
superposição das janelas e o tamanho das janelas em sistemas baseados nos
“Modelos Ocultos de Markov” – (Hidden Markov Models – HMMs), no intuito de
avaliar o desempenho do sistema a partir do percentual do índice de acertos.
Obtiveram resultados de simulações realizadas com diferentes algoritmos de
extração de coeficientes mel-cepstrais a partir de um sistema com ajuste temporal
dinâmico – (dynamic time warping – DTW).
MONTEIRO (2007) descreveu a implementação de um sistema de
reconhecimento de orador, com o objetivo principal de transferir a tecnologia dos
meios científicos para a comunidade.
O sistema de reconhecimento de orador foi baseado em HMM (Hidden Markov
Models) e implementado em C++ (linguagem de programação), utilizando a
ferramenta computacional Visual C++, sendo inserido num objeto COM (Component
Object Model) para Windows.
A partir da criação do objeto COM, converteu-se a implementação num
software dinâmico, ou seja, um sistema com capacidade de ser interligado com
qualquer outro software que necessite de reconhecimento de voz.
Finalizando, avaliou o desempenho do sistema proposto numa base de dados,
considerando-se palavras pronunciadas isoladamente.
SOUZA (2008) utilizou um jogo de futebol de robôs como uma plataforma
experimental para o desenvolvimento do seu trabalho.
Estudou os times envolvidos numa determinada competição, bem como, suas
técnicas empregadas, mas sobretudo, implementou os requisitos necessários para o
pleno funcionamento de uma equipe, incluindo a construção de circuitos eletrônicos,
além do desenvolvimento de um sistema para planejamento e tomada de decisão.
Desenvolveu ainda um sistema de comunicação robusto, necessário para
estabelecer corretamente a transmissão de dados de um computador central aos
robôs em campo.
25
Os módulos de comunicação adotados foram o par TXC1 (transmissor) e
RXD1 (receptor). O circuito transmissor foi acoplado num computador de controle e
os circuitos receptores nos robôs, de forma que cada transmissor enviasse dados a
até cinco receptores (robôs).
Desenvolveu ainda uma máquina de conhecimento que atua como “técnico”
detectando como deve ser a atuação dos times em campo.
TEVAH (2006) descreveu a implementação de um sistema CSR (continuous
speech recognition) com amplo vocabulário para o português brasileiro baseado em
pacotes disponíveis na internet.
Estudou várias técnicas utilizadas pelos sistemas de fala contínua. Algoritmos
de busca foram tratados detalhadamente, além de ter adaptado a metodologia que
utiliza modelos acústicos e lingüísticos no reconhecimento de fala para o português
brasileiro. Fez uma proposição de algoritmo para conversão de sequência fonética
em texto.
Desenvolveu uma base de dados a fim de viabilizar os testes, e obteve curvas
que relacionam variáveis conhecidas em sistemas CSR, como: taxa de acertos de
palavras, perplexidade, diferentes modelos de linguagem, complexidade
computacional, tamanho do vocabulário, etc.
Vários testes foram realizados fazendo variar os principais parâmetros
utilizados em fala contínua.
YNOGUTI (1999) estudou a questão do reconhecimento de fala contínua em
sistemas independentes de locutor e vocábulo médio, utilizando os “Modelos Ocultos
de Markov”. Investigou a influência de alguns conjuntos de sub-unidades fonéticas, e
os modelos de duração e de linguagem no desempenho do sistema, e propôs alguns
métodos de redução no tempo de processamento nos algoritmos de busca.
Fez uma abordagem acerca dos problemas do reconhecimento da fala,
especificando sua arquitetura e unidades fundamentais, os modelos de duração de
palavras, algoritmos de decodificação e modelos de linguagem.
Analisou ainda a estrutura e os tipos dos “Modelos Ocultos de Markov” para a
sua utilização em treinamentos e algoritmos de busca.
Apresentou o sistema desenvolvido, onde utilizou o módulo de extração de
parâmetros e quantização vetorial, o módulo de treinamento, o módulo de geração
do modelo de linguagem e o módulo de reconhecimento.
26
Finalmente testou e analisou os resultados, avaliou o procedimento proposto
para diminuição do tempo de processamento, e realizou suas conclusões.
Após a realização da revisão de algumas literaturas disponíveis, torna-se
importante uma breve descrição acerca desse trabalho.
Muitos autores trataram detalhadamente a questão da variabilidade da fala e
influências sonoras externas no desempenho do sistema de reconhecimento de voz,
além de apresentarem técnicas que visam melhorias desse desempenho.
Muitos outros autores trataram a questão de processos de automatização
industrial e suas mais diversas aplicações, utilizando tecnologias como a
eletropneumática, CLP, pneutrônica e outras.
O diferencial deste trabalho foi a junção de duas tecnologias diferentes,
particularmente na implementação de um sistema de reconhecimento de voz em
circuitos eletropneumáticos intermediados por circuitos eletrônicos, proporcionando
uma nova opção de comando aos sistemas automáticos, seja no setor industrial, no
setor de automação predial, no conforto para pessoas portadoras de deficiências
físicas, no auxílio em sistemas automáticos hospitalares ou em clínicas
odontológicas, etc.
27
CAPÍTULO 2: NOTAS HISTÓRICAS
O desenvolvimento desse trabalho deu-se a partir de um contexto onde as
tecnologias de comunicações e de automatização industrial possuem vastas
aplicações nos mais diversos setores.
No entanto, é fundamentalmente importante analisar e entender a evolução
histórica das tecnologias que presenciamos hoje.
Dessa forma, esse capítulo foi destinado a um breve histórico relacionado a
datas e eventos inerentes à evolução dos sistemas de comunicações, bem como, a
evolução dos sistemas de automatização eletropneumática.
2.1 Evolução dos sistemas de comunicações
Segundo Haykin (2004) a evolução dos sistemas de comunicações deu-se
como segue:
Samuel Morse desenvolveu, em 1835, um sistema de representação de letras,
números e sinais de pontuação que são decodificados e enviados
intermitentemente, denominado código morse. Mais tarde, em 1837, o mesmo
Samuel Morse criou o telégrafo elétrico – importante meio de comunicação à
distância, e precursor das comunicações digitais.
Em 1864, James Clerk Maxwell apresentou uma teoria detalhada à cerca da
natureza eletromagnética da luz (hipótese anteriormente proposta por Michael
Faraday). Além disso, Maxwell também teria previsto a existência das ondas de
rádio, sendo que, em 1887, foram estabelecidas experimentalmente por Heinrich
Hertz.
Em 1875, o professor de surdos, Alexander Graham Bell, inventou um
aparelho capaz de transmitir e reproduzir sons em tempo real através da codificação
elétrica, o telefone.
28
Em 1894, Oliver Lodge demonstrou a comunicação sem fio a curta distância,
e em 1901, Guglielmo Marconi recebeu um sinal de rádio que se originara na
Inglaterra, 2.720 km através do Atlântico. Dessa forma, o caminho estava aberto
para uma enorme evolução das comunicações.
Em 1906, Reginald Fessenden, um acadêmico autodidata, realizou a primeira
transmissão de rádio.
Em 1928, Philo T. Farnsworth, e em 1929, Vladimir K. Zworykin,
demonstraram os primeiros sistemas de televisão totalmente eletrônico.
Durante a II guerra mundial, Alec Reeves desenvolveu uma técnica capaz de
codificar digitalmente os sinais analógicos da voz, cujo intuito era o de criptografá-la.
Em 1948, Claude Shannon publicou um artigo intitulado “A Mathematical
Theory of Communications”, onde são lançados os alicerces teóricos das
comunicações digitais.
A natureza do processamento de sinais e o setor de telecomunicações foram
profundamente modificados a partir da invenção do transistor, em 1948, por Walter
H. Brattain, John Bardeen e William Shockley. Mais tarde, em 1958, Robert Noyce
produz o primeiro circuito integrado, abrindo as portas para o posterior
desenvolvimento dos circuitos integrados em escala muito alta (VLSI), e dos
microprocessadores.
Em 1945, Arthur C. Clark teve a idéia de utilizar um satélite em órbita na Terra
como um ponto de comutação para comunicações entre suas estações na Terra, e
em 1955, John R. Pierce sugeriu a utilização de satélites para comunicações.
Em 1957, a União Soviética lançou o Sputnik 1, o qual transmitiu sinais de
telemetria por 21 dias. Pouco depois, em 1958, os estados Unidos da América
lançaram o Explorer 1, o qual transmitiu por quase 5 meses sinais de telemetria. No
entanto, o passo experimental mais notável na tecnologia de comunicações por
satélite, foi em 1962, com o lançamento do Telstar 1, que era capaz de retransmitir
programas de TV através do Atlântico.
Em 1966, K. C. Kap e G. A. Hockham deram um passo importante com
relação às comunicações ópticas, propondo a utilização de fibra de vidro revestida
como guia de onda dielétrico.
29
Durante a década de 50, os computadores e terminais começaram a
comunicar-se entre si em longas distâncias, utilizando-se de canais telefônicos de
banda de voz operando em baixas velocidades (300 a 1200 b/s).
Ainda no final da década de 50, surgem as primeiras pesquisas tecnológicas
para o reconhecimento de voz, no entanto, apenas na década de 90 é que essa
tecnologia se incorpora comercialmente, com o lançamento do primeiro software
para reconhecimento de voz, o IBM Personal Dictation System, para OS/2, em 1993.
Entre 1950 e 1970 foram realizados vários estudos à cerca de redes de
computadores, sendo o mais significativo em termos de impacto sobre as
comunicações por computador, a ARPANET, que entrou em vigor em 1971.
Em 1985, a ARPANET foi renomeada como Internet. Em 1990, Tim Berners-
Lee, propôs uma interface de software hipermídia para a internet, a qual passou a se
chamar World Wide Web.
Conforme pôde-se observar no breve histórico realizado acima, os grandes
avanços da microeletrônica, dos computadores digitas e dos sistemas ópticos são
responsáveis diretos pelas mudanças no cenário das telecomunicações.
2.2 Evolução dos sistemas de automatização eletropneumática
Conforme relata Bollmann (1997), a utilização do ar como forma de
transmissão de energia é uma técnica muito antiga. Documentos apontam que foi no
primeiro século depois de Cristo, no Egito, que o alexandrino Heron a utilizou pela
primeira vez. Trata-se de um dispositivo para a abertura de um templo. Heron,
utilizou-se do ar aquecido pelas chamas do templo, o qual pressurizava um
recipiente subterrâneo contendo água, provocando uma dilatação e escoamento de
parte dela para outro recipiente, que por sua vez, movia as portas. Dessa forma,
portanto, as portas do templo ficavam “automaticamente” abertas, enquanto
permanecessem acesas as chamas sagradas no interior do altar.
30
É de Heron também, o primeiro registro à cerca da construção de um
reservatório de ar comprimido, objetivando a uniformização da pressão e do fluxo de
ar.
Já no terceiro século depois de Cristo, cita-se um dispositivo construído pelo
mecânico Ctesíbios, também em Alexandria, o qual utilizava a força do ar para
auxiliar no acionamento de um órgão de água. Conhecem-se também, alguns
esboços de máquinas movidas a ar, construídas por Arquimedes.
No entanto, apenas no século XVII é que surgem novas aplicações em torno
da utilização do ar.
Blaise Pascal, em 1663, publicou seus trabalhos sobre a multiplicação de
forças baseada na distribuição homogênea da pressão estática. Mais tarde, a prensa
hidráulica tornou-se a principal aplicação do “Princípio de pascal”.
Já o físico Denis Papin, em 1667, tratou da geração de forças pela diferença
da pressão em torno de corpos no interior de dutos e da possibilidade da sua
utilização para o transporte rápido dos mesmos. Através dos princípios de Papin,
revistos por Medhurst em 1810, chegaram a existir na Inglaterra, locomotivas
movidas a ar, em meados do século XIX.
Outros registros informam-nos da utilização do ar como forma de transmissão
de energia, embora seja apenas no século XIX que o estudo do comportamento e
propriedades do ar, tornou-se efetivamente sistemático, e a pneumática começa
então, ao lado da hidráulica e da eletricidade, a integrar e compor o meio industrial.
Com o crescimento e incorporação da microeletrônica e da informática nos
equipamentos mecânicos, houve também uma reformulação nos comandos
puramente a ar comprimido, de forma que as várias combinações dessas
tecnologias juntamente com a própria pneumática, reúnem vantagens específicas,
acarretando seu crescente uso em automação industrial.
Segundo Fialho (2007), a eletropneumática é o ramo da pneumática que
passa a utilizar a energia elétrica CC ou CA como fonte de energia para o
acionamento de válvulas direcionais, compondo assim as chamadas eletroválvulas e
válvulas proporcionais, energizando ainda sensores magnéticos de posicionamento,
pressostatos, micro-switchs, etc.
31
É, portanto, na intersecção entre a pneumática (responsável basicamente pela
execução de trabalho), e a incorporação entre as várias funções da eletrônica
(responsável pelo controle dos sistemas), que surge a eletropneumática.
Hoje em dia, a eletropneumática está diretamente incorporada às redes de
comunicação digital, tais como, Profibus, DeviceNet, Interbus, Asi-Bus, entre outras.
32
CAPÍTULO 3: O MÓDULO DE RECONHECIMENTO DE VOZ
Para o desenvolvimento experimental desse projeto, o módulo de
reconhecimento de voz escolhido foi o Speech Recognition Kit SR-07, atualmente
comercializado nos Estados Unidos. A escolha desse módulo deu-se em função de
possuir algumas características compatíveis com o projeto que foi desenvolvido,
dentre as quais, podem-se citar: primeiro, é um módulo capaz de reconhecer
palavras em qualquer idioma, desde que seja corretamente “treinado” para isso;
segundo, possui uma grande vantagem que é a sua capacidade de operar
independentemente, uma vez que a maioria dos sistemas de reconhecimento de voz
disponíveis são sistemas que necessitam de computadores para serem operados;
terceiro, é um módulo compacto e com custo relativamente baixo.
A figura 3.1 mostra o módulo de reconhecimento de voz SR-07 (Speech
Recognition Kit SR-07).
Figura 3.1 – Módulo de reconhecimento de voz – SR-07
33
O módulo de reconhecimento de voz SR-07 utiliza três placas de circuito
separadas, conforme mostra a figura 3.2. Uma placa do circuito principal, uma placa
para o teclado e outra placa para o visualizador digital.
Figura 3.2 – O circuito SR-07
Na placa do circuito principal estão instalados o circuito integrado de
reconhecimento de voz HM2007, a memória do circuito (8K x 8 SRAM), e um latch
de saída, implementado com o registrador 74LS373. Este CI armazena o último
comando reconhecido ou treinado, ou ainda códigos de erro do sistema.
Encontram-se também o interruptor liga/desliga, um regulador de voltagem e o
conector para o microfone.
Tanto o teclado quanto o visualizador digital possuem comunicação com o
programa do CI HM2007.
34
O teclado possui doze teclas, sendo dez teclas para os números “0” a “9”,
além das teclas “CLR”, utilizada para apagar as informações da memória, e a tecla
“TRN”, utilizada para a realização do treinamento no reconhecimento das palavras.
Na placa do visualizador digital são instalados dois circuitos integrados CI
7448 (sendo um para cada visualizador), responsável por receber o sinal digital em
paralelo, processá-lo e enviá-lo ao respectivo visualizador.
O módulo de reconhecimento de voz SR-07 possui também um microfone
acoplado, o qual é responsável pela captação do som, além de uma bateria de 9V.
A figura 3.3 mostra um diagrama de blocos simplificado do módulo de
reconhecimento de voz SR-07.
Figura 3.3 – Diagrama de blocos simplificado do módulo SR-07
35
3.1 O circuito integrado de reconhecimento de voz HM2007
O circuito integrado HM2007, mostrado na figura 3.4, contém entrada
analógica de sinal, análise de voz, programação e um sistema de controle de
funções.
Figura 3.4 – Esquema do circuito de reconhecimento de voz SR-07
Possui ainda dois modos de operação, modo manual e modo de CPU.
O modo manual (que foi utilizado nesse projeto) não necessita de um
computador para operá-lo, possibilitando a sua utilização separadamente, e
podendo ser integrado a outros dispositivos eletrônicos.
O modo CPU é uma abordagem atraente para o reconhecimento de voz para
computadores, uma vez que o CI HM2007 funciona como um co-processador para o
processador principal.
Os processos de captação e reconhecimento do som são realizados
independentemente pelo CI HM2007, não havendo necessidade de processamento
do processador principal.
36
Apenas quando o CI HM2007 reconhece um comando válido, é que há uma
sinalização ao processador principal da CPU, o qual fará uso de acordo com sua
programação específica.
O circuito integrado de reconhecimento de voz HM2007 que está inserido no
circuito SR-07 fornece ainda as opções de operar tanto nos sistemas de
reconhecimento de palavras isoladas quanto nos sistemas de reconhecimento de
palavras conectadas, em função do tempo de pronunciamento de cada uma delas.
Nos sistemas de reconhecimento de palavras isoladas, a capacidade do chip
é de 40 palavras com duração máxima de 0,96 segundos, enquanto, nos sistemas
de reconhecimento de palavras conectadas, a capacidade do chip é de 20 palavras,
com duração máxima de 1,92 segundos.
3.2 Categorias dos sistemas de reconhecimento de voz
O reconhecimento de voz é classificado em duas categorias, os sistemas
dependentes de locutor e os sistemas independentes de locutor.
No módulo de reconhecimento de voz SR-07 não há nenhuma característica
de hardware ou de software que diferencie essas duas categorias.
Dessa forma, é a própria maneira de como serão conduzidas as fases de
treinamento e reconhecimento pelos locutores que definirá o tipo de categoria em
vigência.
37
3.2.1 Sistemas dependentes
Os sistemas dependentes de locutor são capazes de reconhecer a fala de
apenas um locutor, aquele para o qual foi treinado. Caso se queira mudar de locutor,
os padrões de referência usados no treinamento também deverão ser modificados
(Dias, 2000).
Segundo o fabricante, o percentual de acertos no reconhecimento de palavras
nesse sistema gira em torno de 95%. No entanto, a desvantagem é que o sistema
mantém essa precisão apenas com a pessoa que o treinou.
3.2.2 Sistemas independentes
Os sistemas independentes de locutor, ao contrário dos sistemas
dependentes de locutor, são capazes de reconhecer a fala de qualquer pessoa,
mesmo que essa não tenha participado do treinamento, para obtenção dos padrões
de referência (Dias, 2000).
Segundo o fabricante do módulo SR-07, o percentual de acertos no
reconhecimento de palavras nesse sistema é ligeiramente menor que o sistema
dependente de locutor. Embora esse percentual não seja quantificado pelo
fabricante, foram realizados vários testes a fim de obtê-lo, e está detalhado nos itens
3.8.2 (nos testes realizados em ambientes silenciosos), e 4.5 (nos testes realizados
em ambientes com a presença do efeito de coarticulação).
A quantificação desse percentual foi avaliada e está descrita na sequência
desse capítulo.
38
3.3 Estilos de reconhecimento
Com relação à forma que os comandos serão pronunciados, os sistemas de
reconhecimento são normalmente classificados em sistemas de reconhecimento de
palavras isoladas, palavras conectadas e fala contínua.
Os sistemas de reconhecimento de palavras isoladas são os mais simples
disponíveis atualmente. Nesse sistema, o locutor pronuncia palavras isoladamente,
ou seja, com uma pausa entre as mesmas. Essa pausa é muito importante, pois
facilita a detecção de início e fim de cada comando, uma vez que a pronúncia das
palavras pode ser mais clara, além de minimizar o efeito de coarticulação (efeito que
promove alteração na forma da pronúncia das palavras devido a influência dos sons
vizinhos).
Os sistemas de reconhecimento de fala contínua possuem uma complexidade
operacional muito maior que os sistemas de reconhecimento de palavras isoladas.
Nesse sistema, o locutor pronuncia frases naturalmente, e o efeito de coarticulação
está sempre presente ao término de uma palavra e início da outra.
Os sistemas de reconhecimento de palavras conectadas são sistemas
intermediários, entre os sistemas de reconhecimento de palavras isoladas e os
sistemas de reconhecimento de fala contínua. Nesse sistema, o locutor deve
pronunciar “frases curtas”, ou seja, frases contendo duas ou três palavras apenas.
No módulo de reconhecimento de voz SR-07, a escolha do estilo de
reconhecimento está basicamente relacionada ao tempo de pronúncia da palavra
proferida pelo locutor.
39
3.4 Treinamento de palavras para serem reconhecidas
Quando o circuito é ligado, o chip HM2007 realiza uma verificação da memória
do sistema, o visualizador digital registra “00” e a luz vermelha do LED acende,
indicando que o sistema está a espera de um comando.
Para iniciar um treinamento, os seguintes passos devem ser seguidos:
primeiro, a tecla “1” deve ser pressionada (o visualizador digital mostrará “01” e a luz
do LED se apagará); segundo, a tecla “TRN” deve ser pressionada (a luz do LED se
acenderá, e será ativado o modo de treinamento para a primeira palavra); terceiro,
utilizando o microfone, a palavra que o sistema reconhecerá deve ser pronunciada.
A luz do LED deverá piscar momentaneamente, indicando que a palavra foi
aceita.
No módulo de reconhecimento de voz SR-07 não há necessidade de se
treinar a mesma palavra várias vezes, a menos que ocorram falhas na captação do
som, ou que seja gerado código de erro.
Caso ocorram falhas, o visualizador digital indicará o código do erro
correspondente, e o treinamento da primeira palavra deve ser repetido.
Para a continuação do treinamento de outras palavras, o mesmo processo
deve ser feito, pressionando a tecla “2” para a segunda palavra, a tecla “3” para a
terceira palavra, e assim por diante.
3.5 Testando o reconhecimento das palavras treinadas
A luz do LED acesa indica que o circuito está pronto pra receber um comando.
Utilizando o microfone, uma palavra (treinada ou não) deve ser pronunciada, e o seu
respectivo número de gravação deve ser mostrado no visualizador digital.
O módulo de reconhecimento de voz SR-07 prevê três tipos de erros, são
eles: o código “55”, que é gerado quando a palavra excede o tempo de 0,96
40
segundos no modo “palavras isoladas”, ou quando a palavra excede o tempo de
1,92 segundos no modo “palavras conectadas”; o código “66”, que é gerado quando
a palavra pronunciada é muito curta; e o código “77”, que é gerado quando a palavra
pronunciada não é reconhecida.
Caso várias palavras tenham sido treinadas, e algumas não estejam sendo
reconhecidas corretamente, pode-se realizar um novo treinamento apenas com a
palavra que está gerando sucessivos erros.
3.6 Apagando os dados da memória
Para apagar todas as palavras treinadas da memória, deve ser pressionado o
número “99” (o visualizador digital mostrará o número “19”, o que não representa um
erro para o circuito), seguido da tecla “CLR”.
É importante observar que todas as vezes que o módulo SR-07 for desligado,
os dados da memória serão apagados.
3.7 Testando o módulo de reconhecimento de voz SR-07
Para a realização do teste do módulo de reconhecimento de voz SR-07 foram
feitos quatro simulações em ambiente silencioso, simulando a ausência da influência
de quaisquer sons externos, utilizando dois diferentes locutores. O treinamento das
palavras a serem reconhecidas foi realizado conforme descrito no item 3.4.
Após o treinamento das palavras, as mesmas foram testadas três vezes.
Quando houve acerto, a palavra seguinte foi treinada, quando não houve acerto, o
procedimento foi repetido.
41
As palavras treinadas foram: “começo” (1), “solenóide” (2), “Fim” (3), “Pressão”
(4) e “volume” (5). Nas quatro simulações também foram testadas três palavras não
treinadas, são elas: “e”, “eletropneumática” e “sistema de reconhecimento de voz”
(pronunciada continuamente, como se fosse uma única palavra). Cada palavra,
treinada ou não, foi testada aleatoriamente dez vezes.
Com relação às palavras treinadas, foram consideradas acertadas quando o
visualizador digital apresentou corretamente o seu número correspondente no
momento do treinamento.
Quanto às palavras não treinadas, cada uma delas possui característica
específica (muito curta ou muito longa) de acordo com o módulo de reconhecimento
de voz SR-07, de modo que foi considerado acertado o “código de erro” gerado,
quando o visualizador digital apresentou corretamente o número do código de erro
em função da característica de cada palavra.
No caso da palavra “e”, foi considerado acerto quando o módulo emitiu o
código “66”, fornecido a palavras muito curtas.
A palavra “eletropneumática” foi considerada acerto quando o módulo emitiu o
código de erro “77” (nenhuma palavra encontrada).
A locução “sistema de reconhecimento de voz” (pronunciada continuamente)
foi considerada acertada quando houve geração do código de erro “55”, fornecido a
palavras muito longas.
Caso a palavra pronunciada tenha sido confundida com outra palavra
treinada, a coluna (*) foi demarcada, e foi considerado de fato, erro.
Nas tabelas 3.1, 3.2, 3.3 e 3.4, as colunas referentes à geração de códigos de
erro são: “# 55” para palavras longas; “# 66” para palavras curtas; e “# 77” para
palavras que não foram reconhecidas como treinadas.
Durante a fase de treinamento e de reconhecimento não foram verificadas a
intensidade sonora dos sons emitidos pelos locutores. É possível ainda que tenha
ocorrido algum tipo de variabilidade de fala nas simulações.
A seguir é apresentado o resultado de cada uma das simulações realizadas
pelos locutores 1 e 2, nos sistemas dependentes e independentes de locutor.
42
3.7.1 Primeira simulação
A primeira simulação foi realizada pelo locutor 1, utilizando o sistema
dependente de locutor e o sistema de reconhecimento de palavras isoladas.
Os resultados obtidos estão mostrados na tabela 3.1.
Tabela 3.1 – Resultados obtidos no reconhecimento de voz da primeira
simulação.
Palavra Acertos # 55 # 66 # 77 (*) Percentual de
acertos
“Começo” 6 0 0 0 4 60%
“Solenóide” 9 0 0 0 1 90%
“Fim” 10 0 0 0 0 100%
“Pressão” 9 0 0 0 1 90%
“Volume” 9 0 0 0 1 90%
“Eletropneumática” 10 0 0 10 0 100%
“E” 9 0 9 0 1 90%
“Sistema de
reconhecimento
de voz”
10 10
0
0 0 100%
3.7.2 Segunda simulação
A segunda simulação foi realizada pelo locutor 2, utilizando o sistema
dependente de locutor e o sistema de reconhecimento de palavras isoladas.
Os resultados obtidos estão mostrados na tabela 3.2.
43
Tabela 3.2 – Resultados obtidos no reconhecimento de voz da segunda
simulação.
Palavra Acertos # 55 # 66 # 77 (*) Percentual de
acertos
“Começo” 10 0 0 0 0 100%
“Solenóide” 10 0 0 0 0 100%
“Fim” 10 0 0 0 0 100%
“Pressão” 10 0 0 0 0 100%
“Volume” 9 0 0 0 1 90%
“Eletropneumática” 10 0 0 10 0 100%
“E” 6 0 6 0 4 60%
“Sistema de
reconhecimento
de voz”
10 10
0
0 0 100%
A análise dos resultados obtidos nas tabelas 3.1 e 3.2 encontram-se no item
3.8.1.
3.7.3 Terceira simulação
A terceira simulação foi treinada pelo locutor 1 e testada pelo locutor 2,
utilizando o sistema independente de locutor e o sistema de reconhecimento de
palavras isoladas.
44
Os resultados obtidos estão mostrados na tabela 3.3.
Tabela 3.3 – Resultados obtidos no reconhecimento de voz da terceira
simulação.
Palavra Acertos # 55 # 66 # 77 (*) Percentual de
acertos
“Começo” 9 0 0 1 0 90%
“Solenóide” 9 0 0 1 0 90%
“Fim” 10 0 0 0 0 100%
“Pressão” 0 0 0 0 10 0%
“Volume” 10 0 0 0 0 100%
“Eletropneumática” 10 0 0 10 0 100%
“E” 5 0 5 0 5 50%
“Sistema de
reconhecimento
de voz”
10 10
0
0 0 100%
3.7.4 Quarta simulação
A quarta simulação foi treinada pelo locutor 2 e testada pelo locutor 1,
utilizando o sistema independente de locutor e o sistema de reconhecimento de
palavras isoladas.
Os resultados obtidos estão mostrados na tabela 3.4.
45
Tabela 3.4 – Resultados obtidos no reconhecimento de voz da quarta
simulação.
Palavra Acertos # 55 # 66 # 77 (*) Percentual de
acertos
“Começo” 7 0 0 2 1 70%
“Solenóide” 7 0 0 3 0 70%
“Fim” 10 0 0 0 0 100%
“Pressão” 3 0 0 1 6 30%
“Volume” 9 0 0 0 1 90%
“Eletropneumática” 9 0 0 9 1 90%
“E” 8 0 8 0 2 80%
“Sistema de
reconhecimento
de voz”
10 10
0
0 0 100%
A análise dos resultados obtidos nas tabelas 3.3 e 3.4 encontram-se no item
3.8.2.
3.8 Análise dos resultados do teste de reconhecimento de voz
A análise dos resultados obtidos será dividida em dois grupos: análise dos
resultados obtidos pelo sistema dependente de locutor (1a e 2a simulações), e
análise dos resultados obtidos pelo sistema independente de locutor (3a e 4a
simulações), em ambientes silenciosos.
46
3.8.1 Análise dos resultados obtidos pelo sistema dependente de locutor
Diante dos testes realizados em ambientes propícios (ambientes silenciosos),
verificou-se que o percentual geral de acertos para o sistema dependente de locutor
foi de 91,9%, estando, portanto, muito próximo da informação do fabricante (95%).
Um fator que chama a atenção, é que o percentual geral de acertos das
palavras treinadas foi praticamente o mesmo do percentual geral das palavras não
treinadas, ou seja, em torno de 92%, o que evidencia um desempenho muito bom do
módulo SR-07.
Evidentemente, um bom treinamento do sistema aliado a uma constância no
desempenho dos comandos para reconhecimento, tende a promover melhores
resultados, uma vez que, um dos principais motivos de baixos desempenhos está
relacionado à variabilidade dos sinais de voz. Há necessidade também de se levar
em conta as próprias condições físicas e emocionais do locutor, tanto no processo
de treinamento quanto no processo de comando para reconhecimento, a fim de
obter resultados mais eficientes.
3.8.2 Análise dos resultados obtidos pelo sistema independente de
locutor
O percentual geral de acertos para o sistema independente de locutor foi de
78,8%, sendo, portanto, menos eficiente que o sistema dependente de locutor.
Um fator que chama a atenção, é que nas duas simulações realizadas, o
percentual de acertos das palavras não treinadas foi maior que o percentual de
acertos das palavras treinadas, o que evidencia uma queda no desempenho do
módulo SR-07 em relação à dependência de locutor.
Observou-se também que uma palavra “mal” treinada dificilmente será
reconhecida, como foi o caso da palavra “pressão” na tabela 3.3. Nesse caso, é
47
importante que a palavra seja novamente treinada e testada, embora, em alguns
casos, mesmo diante de vários treinamentos, o módulo SR-07 não apresente
resultados satisfatórios.
Notou-se ainda, que eventualmente o módulo SR-07 “confunde” uma
determinada palavra treinada com outra, também treinada. O maior índice desse fato
deu-se nos sistemas independentes de locutor.
Nos sistemas independentes de locutor, além da variabilidade da voz
(características diretamente ligadas às condições físicas e emocionais do locutor), as
diferenças lingüísticas (sotaque, dialeto), também são fatores que contribuem para
uma menor eficiência nos sistemas de reconhecimento de voz.
De uma forma geral, não é possível eliminar a variabilidade da voz dos
locutores em sistemas dependentes e independentes, embora, atualmente, muitos
estudos apontem para a normalização (modelação) dessas variações, que devem
ser realizadas diretamente pelas tecnologias de reconhecimento de voz adotado,
visando exatamente melhorias significativas.
Em condições propícias, o módulo SR-07 apresentou um desempenho
satisfatório. No entanto, na prática do dia a dia, essa talvez não seja a condição a
que o módulo será submetido, dessa forma, tornou-se importante a realização de
outros testes simulando ambientes com características diferentes e submetidos a
ruídos externos.
Estes testes foram realizados e estão apresentados no próximo capítulo.
48
CAPÍTULO 4: ANÁLISE DE DESEMPENHO DO MÓDULO DE RECONHECIMENTO DE VOZ SR-07 COM IMPLEMENTAÇÃO DO EFEITO DE
COARTICULAÇÃO
Toda ação do circuito eletropneumático implementada nesse trabalho foi
executada via comando de voz reconhecida pelo módulo SR-07. Embora o
fabricante informe, através do catálogo do produto, que o índice de desempenho do
módulo seja da ordem de 95%, não há maiores esclarecimentos nem informações
detalhadas acerca desse percentual, especialmente em relação à influência do ruído
de fundo nesse desempenho.
Conforme foi descrito no capítulo anterior, o módulo de reconhecimento de
voz SR-07 apresentou bons resultados em ambientes considerados propícios, no
entanto, devido ao seu papel extremamente importante no processo de
automatização, tornou-se necessário a realização de novos testes e simulações, a
fim de se obter resultados mais precisos acerca do seu desempenho, especialmente
em possíveis ambientes a que será submetido.
Embora sejam muitos os fatores, especialmente os relacionados às
variabilidades da fala, que influenciam em sistemas de reconhecimento de voz, foi
tratado aqui a influência da variação do nível sonoro externo no desempenho desse
módulo, ou seja, foi induzido o efeito de coarticulação. Segundo Dias (2000),
coarticulação é o efeito que provoca alteração na forma de pronúncia dos sons
devido à influência dos sons vizinhos.
Além de analisar o desempenho do reconhecimento de voz em palavras
treinadas, foi analisado também o desempenho do sistema em palavras não
treinadas, uma vez que, caso a palavra não treinada seja “confundida” com outra
treinada, possa ocasionar efeitos indesejáveis.
Foram realizados testes em dois ambientes com características diferentes,
embora, com nível sonoro médio equivalente. Num dos ambientes foram simulados
oscilações de máximos e mínimos na amplitude das ondas sonoras emitidas. No
outro ambiente, as oscilações da amplitude das ondas sonoras foram minimizadas.
Na obtenção das bases de dados foram realizados treinamentos e testes com
quatro locutores diferentes, possibilitando a análise do desempenho do módulo SR-
49
07 em sistemas dependentes e independentes de locutor, utilizando-se palavras
isoladas.
4.1 Metodologia utilizada
Para obtenção dos resultados, as palavras treinadas e testadas foram
gravadas, com o intuito de minimizar alguns efeitos de variabilidades de fala,
principalmente os associados às condições físicas e emocionais do locutor.
Para a captação dos sons foi utilizado um microfone Clone tipo condensador,
com polarização Omni-direcional e sensibilidade de 58 dB (+/- 3 dB) na faixa de
freqüência entre 20 Hz e 20 kHz. Para a gravação das palavras foi utilizado um
notebook HP, com processador Intel Pentium Duol-Core, sob a plataforma Windows
Vista.
Foram realizados treinamentos com quatro locutores diferentes, obtendo
quatro resultados diferentes para os sistemas dependentes de locutor. Nesse
sistema, o teste de reconhecimento foi realizado pelo próprio locutor que realizou o
treinamento.
Nos sistemas independentes de locutor, utilizou-se um locutor para a
realização do treinamento, e locutores alternados nos testes de reconhecimento.
Seis palavras (referentes a cores) foram testadas, são elas: (1) amarelo, (2)
vermelho, (3) preto, (4) marrom, (5) roxo e (6) bege. As palavras “1”, “2” e “3” foram
treinadas para serem reconhecidas, e as palavras “4”, “5” e “6”, não foram treinadas.
Para as palavras treinadas, foi considerado “acerto” quando o sistema as
reconheceu, e “não acerto” quando o sistema gerou código de erro, ou quando certa
palavra treinada foi “confundida” com outra, também treinada.
Para as palavras não treinadas, o “acerto” foi considerado quando o sistema
gerou um código de erro específico (referente a palavra não treinada) ao serem
pronunciadas. Em contrapartida, foi considerado “não acerto” para os demais
50
códigos de erro (palavras muito curtas ou muito cumpridas), ou quando o sistema a
“confundiu” com outra palavra treinada.
Para a implementação do efeito de coarticulação, os testes foram realizados
num ambiente fechado com variações específicas do nível sonoro, medido por um
decibelímetro Minipa MSL – 1352A, com range de operação entre 30 dB e 130 dB.
Dois tipos de ruídos foram implementados, ambos com variação de nível
sonoro entre 50 dB e 70 dB (sendo que acima de 70 dB o módulo SR-07 torna-se
inoperante). O primeiro tipo de ruído foi definido por conversações normais entre
pessoas e músicas, e o segundo tipo, definido por sons contínuos de máquinas e
“chiado” de rádio.
Em todos os testes de reconhecimento, a intensidade sonora captada pelo
microfone do módulo de reconhecimento de voz SR-07, foi entre 1 x 10-5 W/m2 e 1 x
10-4 W/m2. Ao todo foram realizados 2.160 testes. Os resultados foram tabelados
(tabelas 4.1, 4.2, 4.3, 4.4, 4.5, 4.6, 4.7 e 4.8), e avaliados (nos itens 4.3, 4.5 e 4.6).
4.2 Análise comparativa de sistemas dependentes de locutor com
ocorrência de coarticulação
Embora sejam muitos os fatores que influenciam num sistema de
reconhecimento de voz, será apresentado nessa seção o grau de interferência dos
sons (ruídos) externos na performance do módulo de reconhecimento de voz SR-07,
em sistemas dependentes de locutor. Os ruídos foram divididos em dois tipos:
conversação normal entre pessoas ou músicas (tipo A) e “chiados” de máquinas ou
rádio (tipo B).
Em conversações de pessoas ou músicas é pouco provável a manutenção
exata do nível sonoro ambiente, uma vez que ocorrem picos na amplitude das ondas
sonoras emitidas. Em “chiados” de máquinas ou de rádio, por exemplo, com
emissão de sons contínuos, há uma tendência maior de manter a estabilidade do
nível sonoro ambiente.
51
As bases de dados de treinamentos e testes com ocorrência de coarticulação
e, respectivos percentuais de acertos no reconhecimento das palavras, estão
descritas nas tabelas 4.1, 4.2, 4.3 e 4.4.
Tabela 4.1 – Descrição da base de dados treinada e testada pelo locutor 1,
com ocorrência de coarticulação tipo A.
Palavra % Acertos
50 dB +/- 3 dB
% Acertos
55 dB +/- 3 dB
% Acertos
60 dB +/- 3 dB
% Acertos
65 dB +/- 3 dB
Amarelo 70 50 40 0
Vermelho 90 90 60 30
Preto 100 100 100 90
Desempenho 86,7 80,0 66,7 40,0
Marron 100 100 100 100
Roxo 100 100 100 100
Bege 100 100 100 100
Desempenho 100,0 100,0 100,0 100,0
Tabela 4.2 – Descrição da base de dados treinada e testada pelo locutor 2,
com ocorrência de coarticulação tipo A.
Palavra % Acertos
50 dB +/- 3 dB
% Acertos
55 dB +/- 3 dB
% Acertos
60 dB +/- 3 dB
% Acertos
65 dB +/- 3 dB
Amarelo 100 90 60 30
Vermelho 100 100 100 80
Preto 100 100 90 70
Desempenho 100,0 96,7 83,3 60,0
Marron 100 100 100 90
Roxo 100 100 100 100
Bege 100 100 100 90
Desempenho 100,0 100,0 100,0 93,3
52
Tabela 4.3 – Descrição da base de dados treinada e testada pelo locutor 3,
com ocorrência de coarticulação tipo B.
Palavra
% Acertos
50 dB
(+/- 3 dB)
% Acertos
55 dB
(+/- 3 dB)
% Acertos
60 dB
(+/- 3 dB)
% Acertos
65 dB
(+/- 3 dB)
% Acertos
68 dB
(+/- 3 dB)
Amarelo 100 100 100 100 60
Vermelho 100 100 100 100 80
Preto 100 100 90 100 90
Desempenho 100,0 100,0 96,7 100,0 76,7
Marron 80 80 90 90 100
Roxo 100 100 100 100 100
Bege 100 100 100 100 100
Desempenho 93,3 93,3 96,7 96,7 100,0
Tabela 4.4 – Descrição da base de dados treinada e testada pelo locutor 4,
com ocorrência de coarticulação tipo B.
Palavra
% Acertos
50 dB
(+/- 3 dB)
% Acertos
55 dB
(+/- 3 dB)
% Acertos
60 dB
(+/- 3 dB)
% Acertos
65 dB
(+/- 3 dB)
% Acertos
68 dB
(+/- 3 dB)
Amarelo 100 100 100 100 90
Vermelho 100 100 100 90 90
Preto 100 100 100 100 80
Desempenho 100,0 100,0 100,0 96,7 86,7
Marron 100 100 100 100 100
Roxo 100 100 100 100 100
Bege 70 70 80 60 40
Desempenho 90,0 90,0 93,3 86,7 80,0
53
4.3 Resultados do sistema dependente de locutor
Os resultados foram apresentados em função do tipo de ruído implementado
na realização dos testes.
Em primeiro lugar, a partir dos resultados obtidos na ocorrência de
coarticulação tipo A, observou-se que, a medida que o nível sonoro ambiente foi
aumentando, o desempenho do sistema para palavras treinadas foi diminuindo. Em
conversações ou músicas, os picos máximos de amplitude de ondas sonoras
provocaram especialmente geração de código de erro pertinente à palavra que não
constava como “treinada”, ou código de erro pertinente à palavra “muito curta”.
Em ambientes com variação de nível sonoro entre 50 dB e 60 dB (+/- 3 dB), o
desempenho do sistema esteve na ordem de 85,6%, e em ambientes com nível
sonoro de 65 dB (+/- 3 dB), o desempenho caiu rapidamente para a ordem de 50%.
Para palavras não treinadas, o desempenho do sistema foi da ordem de 99,2
%, com variação de nível sonoro entre 50 dB e 65 dB (+/- 3 dB). Esse índice,
embora alto, pode ser considerado “duvidoso”, baseando-se no baixo índice obtido
em palavras treinadas.
Acima de 65 dB, o módulo de reconhecimento de voz SR-07 começou a gerar
sucessivos códigos de erro, não sendo possível a realização de testes.
Em segundo lugar, a partir dos resultados obtidos na ocorrência de
coarticulação tipo B, observou-se que, mesmo com a elevação do nível sonoro, de
50 dB a 65 dB (+/- 3 dB), o desempenho do sistema se manteve estável, com
percentual de acerto da ordem de 99,2% para palavras treinadas. Com o nível
sonoro ambiente de 68 dB (+/- 3 dB), esse percentual caiu para 81,7%.
Não foi observado variação significativa no percentual de acertos para
palavras não treinadas, mesmo com variação do nível sonoro entre 50 dB e 68 db
(+/- 3 dB). Esse índice esteve na ordem de 92%.
Acima de 68 dB, o módulo de reconhecimento de voz SR-07 começou a gerar
sucessivos códigos de erro, predominantemente referente ao de “palavras longas”,
não sendo possível a realização de testes. Esse resultado foi bastante interessante,
pois encontrou-se perfeitamente coerente com a própria característica do ambiente
54
tipo B, ou seja, com poucas oscilações de máximos e mínimos referentes às
amplitudes das ondas sonoras provenientes do ruído. Essa constância na
intensidade sonora do ruído, certamente fez com que o sistema o “confundisse”
como sendo uma continuidade da palavra pronunciada.
O gráfico 4.1 apresenta uma síntese do desempenho do módulo SR-07 a
partir dos testes realizados em sistemas dependentes de locutor.
Gráfico 4.1 – Gráfico de desempenho em sistemas dependentes de locutor
Nesse gráfico, adotou-se para a série 1, os resultados obtidos para as
palavras não treinadas em ambientes tipo B; a série 2, os resultados obtidos para as
palavras treinadas em ambientes tipo B; a série 3, os resultados obtidos para as
palavras não treinadas em ambientes tipo A; e a série 4, os resultados obtidos para
as palavras treinadas em ambientes tipo A.
O melhores resultados dessa categoria (dependência de locutor) ocorreu em
ambientes com variação de nível sonoro entre 50 dB e 65 dB (+/- 3 dB), sem
excessivas oscilações nas amplitudes das ondas sonoras (tipo B), minimizando
dessa forma o efeito de coarticulação. Nesse caso, o percentual de acertos foi da
ordem de 95,9%, confirmando a expectativa do fabricante, que foi de 95%. Com 68
55
dB (+/- 3 dB), houve uma pequena queda de 10% no desempenho. Acima de 68 dB,
o sistema torna-se instável e inoperante.
4.4 Análise comparativa de sistemas independentes de locutor com
ocorrência de coarticulação
É apresentado nesse tópico o grau de interferência dos sons (ruídos) externos
no desempenho do módulo de reconhecimento de voz SR-07, em sistemas
independentes de locutor nos ambientes tipo A e tipo B.
Na implementação do sistema independente de locutor, o treinamento foi
realizado por um dos locutores, e os testes foram realizados pelos locutores
restantes, de forma aleatória.
As bases de dados de treinamentos e testes com ocorrência de coarticulação
e, respectivos percentuais de acertos no reconhecimento das palavras, estão
descritas nas tabelas 4.5, 4.6, 4.7 e 4.8.
Tabela 4.5 – Descrição da base de dados treinada pelo locutor 1, e testada
aleatoriamente pelos locutores 2, 3 e 4, com ocorrência de coarticulação tipo A.
Palavra % Acertos
50 dB +/- 3 dB
% Acertos
55 dB +/- 3 dB
% Acertos
60 dB +/- 3 dB
% Acertos
65 dB +/- 3 dB
Amarelo 0 0 0 0
Vermelho 0 0 0 0
Preto 90 100 60 10
Desempenho 30,0 33,3 20,0 3,3
Marron 100 100 100 100
Roxo 100 100 100 100
Bege 100 100 100 100
Desempenho 100,0 100,0 100,0 100,0
56
Tabela 4.6 – Descrição da base de dados treinada pelo locutor 2, e testada
aleatoriamente pelos locutores 1, 3 e 4, com ocorrência de coarticulação tipo A.
Palavra % Acertos
50 dB +/- 3 dB
% Acertos
55 dB +/- 3 dB
% Acertos
60 dB +/- 3 dB
% Acertos
65 dB +/- 3 dB
Amarelo 30 20 30 30
Vermelho 0 0 0 0
Preto 70 60 60 50
Desempenho 33,3 26,7 30,0 26,7
Marron 100 100 100 100
Roxo 100 100 100 90
Bege 100 100 100 100
Desempenho 100,0 100,0 100,0 96,7
Tabela 4.7 – Descrição da base de dados treinada pelo locutor 3, e testada
aleatoriamente pelos locutores 1, 2 e 4, com ocorrência de coarticulação tipo B.
Palavra
% Acertos
50 dB
(+/- 3 dB)
% Acertos
55 dB
(+/- 3 dB)
% Acertos
60 dB
(+/- 3 dB)
% Acertos
65 dB
(+/- 3 dB)
% Acertos
68 dB
(+/- 3 dB)
Amarelo 0 0 0 0 0
Vermelho 0 0 0 0 0
Preto 20 40 20 20 10
Desempenho 6,7 13,3 6,7 6,7 3,3
Marron 100 100 90 100 90
Roxo 100 100 90 100 100
Bege 100 100 100 90 100
Desempenho 100,0 100,0 93,3 96,7 96,7
57
Tabela 4.8 – Descrição da base de dados treinada pelo locutor 4, e testada
aleatoriamente pelos locutores 1, 2 e 3, com ocorrência de coarticulação tipo B.
Palavra
% Acertos
50 dB
(+/- 3 dB)
% Acertos
55 dB
(+/- 3 dB)
% Acertos
60 dB
(+/- 3 dB)
% Acertos
65 dB
(+/- 3 dB)
% Acertos
68 dB
(+/- 3 dB)
Amarelo 40 50 20 30 0
Vermelho 0 0 0 0 0
Preto 80 80 90 80 30
Desempenho 40,0 43,3 36,7 36,7 10,0
Marron 100 100 100 100 100
Roxo 100 100 100 100 100
Bege 20 30 10 30 90
Desempenho 73,3 76,7 70,0 76,7 96,7
4.5 Resultados do sistema independente de locutor
Diferentemente dos resultados apresentados nos sistemas dependentes de
locutor, não foram observadas diferenças significativas nos testes realizados em
ambientes com ruídos tipo A ou tipo B, nas situações em que os testes de
reconhecimento foram realizados por locutores diferentes daqueles que fizeram o
treinamento.
Uma pequena diferença percebida foi o limite do nível sonoro aceitável pelo
módulo de reconhecimento de voz SR-07. Para as simulações realizadas em
ambientes com ruído tipo A, o nível sonoro máximo sem geração consecutivas de
códigos de erros foi de 65 dB (+/- 3 dB), enquanto nas simulações realizadas em
ambientes com ruído tipo B, consegue-se chegar aos 68 dB (+/- 3 dB), sem geração
consecutiva de códigos de erros, muito embora, o percentual de acertos tenha sido
extremamente baixo em todos os casos.
58
De acordo com os resultados obtidos para as palavras treinadas, verificou-se
que, de fato, as maiores influências no desempenho do módulo SR-07, encontram-
se nas próprias características pertinentes aos sistemas independentes de locutor.
Dessa forma, o desempenho do sistema nos ambientes tipo A ou tipo B, com
variação do nível sonoro entre 50 dB e 65 dB (+/- 3 dB) para palavras treinadas, foi
da ordem de 22,6%.
Para as palavras não treinadas, o percentual considerado de acertos foi da
ordem de 93,2%, também, sem diferenciação do tipo de ambiente e variações dos
níveis sonoros. Esse índice, embora elevado, pode provocar certa discussão e ser
considerado “duvidoso”, se comparado com o desempenho obtido nas simulações
de palavras treinadas (22,6%), bem como, o próprio código de erro gerado com
freqüência em ambos os casos (código de erro referente a ausência de
treinamento).
Destacou-se também a inoperância do sistema em níveis sonoros acima de
65 dB (+/- 3 dB) nos ambientes tipo A, e 68 dB (+/- 3 dB) nos ambientes tipo B.
Acima do limite de nível sonoro no primeiro caso, os erros que ocorreram com
freqüência foi pertinente a palavras não treinadas. Em contrapartida, acima do limite
de nível sonoro no segundo, os erros que ocorreram com freqüência foi pertinente a
palavras muito longas (o módulo SR-07 reconhece palavras isoladas pronunciadas
dentro de um intervalo de tempo de até 1,92 s).
De fato, os piores desempenhos ocorreram nos sistemas independentes de
locutor. Não houve variação significativa em termos de desempenho nas simulações
realizadas nos ambientes tipo A e tipo B, sendo que o percentual médio de acertos
para palavras treinadas, com variação de nível sonoro entre 50 db e 65 db (+/- 3 dB),
foi de 24,5%. Nesse caso, o próprio índice elevado de acertos para palavras não
treinadas (média de 92,7%), entre 50 dB e 65 dB (+/- 3 dB), torna-se duvidoso, em
virtude do baixo índice de acerto das palavras treinadas.
Dessa forma, a eficácia do módulo de reconhecimento de voz SR-07 em
sistemas cujo locutor que pronunciará os comandos (palavras) para reconhecimento
não foi o mesmo que realizou o treinamento, é extremamente baixa. Além disso, a
ocorrência de coarticulação afeta diretamente o desempenho do módulo de
reconhecimento de voz SR-07.
59
Essa interferência pode ser minimizada se o ruído externo não for muito
instável (apresentando poucas variações nas amplitudes das ondas sonoras),
mesmo com variação significativa de nível sonoro (até 65 dB, +/- 3 dB).
O gráfico 4.2 apresenta uma síntese do desempenho do módulo SR-07 a
partir dos testes realizados em sistemas independentes de locutor.
Gráfico 4.2 – Gráfico de desempenho em sistemas independentes de locutor
Nesse gráfico, adotou-se para a série 1, os resultados obtidos para as
palavras não treinadas em ambientes tipo B; a série 2, os resultados obtidos para as
palavras treinadas em ambientes tipo B; a série 3, os resultados obtidos para as
palavras não treinadas em ambientes tipo A; e a série 4, os resultados obtidos para
as palavras treinadas em ambientes tipo A.
60
4.6 Comparativo entre os sistemas dependentes e independentes de
locutor
O gráfico 4.3 apresenta os resultados dos testes realizados nos sistemas
dependentes e independentes de locutor, realizados em ambientes diferentes. O
percentual de acertos apontado pelo gráfico refere-se apenas às palavras treinadas.
As siglas “SDL–A”, “SDL–B”, “SIL–A” e “SIL–B”, referem-se, respectivamente,
aos resultados obtidos na categoria de dependência de locutor, no ambiente tipo A,
aos resultados obtidos na categoria de dependência de locutor, no ambiente tipo B,
aos resultados obtidos na categoria de independência de locutor, no ambiente tipo
A, e aos resultados obtidos na categoria de independência de locutor, no ambiente
tipo B.
Nesse gráfico fica bem evidenciado que o melhor desempenho do módulo SR-
07 para palavras treinadas ocorreu nos sistemas dependentes de locutor em
ambiente “tipo B”, cujo nível sonoro esteve entre 50 e 65 dB.
Gráfico 4.3 – Gráfico comparativo entre os sistemas dependentes e
independentes de locutor
61
CAPÍTULO 5: O CIRCUITO ELÉTRICO
A concepção do hardware deu-se a partir da analise do circuito disponível no
módulo de reconhecimento de voz SR-07, do tipo de comunicação escolhido e dos
requisitos para saída.
Além disso, no caso específico desse projeto, o circuito elétrico de controle do
circuito eletropneumático foi dividido em dois: um “circuito transmissor”, posicionado
à distância (de onde serão realizados os comandos), e outro, “circuito receptor”,
posicionado junto às válvulas de comando que energiza as bobinas das válvulas
solenóides.
5.1 O método de transmissão
Para a escolha do método de transmissão de dados levou-se em conta
principalmente a compatibilidade das características técnicas de transmissão com as
características técnicas do módulo de reconhecimento de voz SR-07, bem como, o
custo dos componentes elétricos.
Dessa forma, escolheu-se que a transmissão dos dados fosse feita por rádio
freqüência (RF), utilizando-se os módulos TXC1 (Hybrid Transmitter) e RXD1 (Hybrid
Receiver), mostrados na figura 5.1.
A transmissão e recepção de dados sem fio (wireless) dos módulos TXC1 e
RXD1 pode ocorrer com um alcance de até 100 metros (sem obstáculos), desde que
a antena e a fonte de alimentação do transmissor sigam as recomendações técnicas
do fabricante.
As faixas de freqüência de operação dos módulos TXC1 e RXD1 são de 315
MHz, 418MHz e 434 MHz. Essas faixas de freqüências são pré-reguladas pelo
fabricante, dispensando qualquer tipo de regulagem por parte do desenvolvedor.
62
No desenvolvimento desse projeto foi utilizada a faixa de freqüência de 434
MHz para o par TXC1 e RXD1.
A largura de banda (para a transferência dos dados) do módulo TXC1 é de 4
kHz, já a do módulo RXD1, é de 2 kHz. Portanto, para que o módulo receptor RXD1
consiga receber os dados corretamente, o transmissor TXC1 deverá limitar-se a
transmitir os dados numa taxa inferior ou igual a 2 kHz.
Tanto o transmissor TXC1, quanto o receptor RXD1, adotam a modulação
ASK.
Figura 5.1 – Os módulos TXC1 e RXD1
5.2 O transmissor
Ao analisar o módulo, verificou-se que a única saída disponível seria o
conector que leva aos displays, ou seja, os 4-bits que saem do CI 7448, sendo
assim, o local ideal para interceptar a informação de saída do módulo.
63
Achado o ponto, escolheu-se os 4 pinos que controlam o display das unidades
para ser trabalhado, uma vez que só foram utilizados 8 saídas nesse projeto.
A necessidade de um amplificador de sinal deu-se porque a saída de sinal do
módulo SR-07 não conseguia suprir o display e o transmissor ao mesmo tempo.
A figura 5.2 mostra o esquema do circuito de reconhecimento de voz SR-07.
Figura 5.2 – Circuito do módulo SR-07 (saída dos displays)
A figura 5.3 mostra a concepção de ligação elétrica para o circuito
transmissor.
Nessa concepção, o circuito principal do módulo SR-07, o visualizador digital
(display) e o transmissor são alimentados com a tensão de 5 V.
Inicialmente, os dados eram enviados a dois circuitos integrados (um circuito
integrado pra cada display), conforme descrito no capítulo 3. Uma vez que para o
desenvolvimento desse trabalho foram utilizados apenas 4 comandos de voz, optou-
se para a interceptação dos dados enviados apenas para o display das unidades
(com 8 saídas, proporcionando capacidade máxima para 8 comandos diferentes).
Tal fato permitirá apresentar uma metodologia para simular um ambiente de
64
independência de locutor, de forma a manter um alto desempenho no módulo SR-
07. Essa metodologia está descrita no item 5.7.
Após a interceptação e amplificação do sinal, os dados são enviados ao
transmissor TXC1.
Figura 5.3 – Concepção de ligação elétrica para o circuito transmissor.
5.3 O circuito transmissor
O circuito transmissor foi dividido basicamente em três circuitos menores, que
são: o circuito de alimentação, o circuito amplificador de sinal e o circuito encoder
paralelo/serial.
65
5.3.1 O circuito de alimentação do transmissor
O circuito de alimentação é alimentado pelo conector J1, sendo que este está
conectado à alimentação 5 V do módulo SR-07. Conta ainda com um LED D1, que
indica quando o circuito está ligado.
A figura 5.4 mostra o circuito de elétrico de alimentação do transmissor.
Figura 5.4 – O circuito elétrico de alimentação do transmissor
5.3.2 O circuito amplificador de sinal
O circuito recebe sinal das unidades do módulo SR-07 através do conector J2
e amplifica em corrente, pelos transistores BC549 ,Q1 a Q4, enviando os dados para
o display e o módulo transmissor, sendo que as saídas A_AMP, B_AMP, C_AMP e
D_AMP são os 4-bits de sinal do display já amplificados.
66
A figura 5.5 mostra o circuito amplificador de sinal.
Figura 5.5 – O circuito amplificador de sinal
5.3.3 O circuito encoder paralelo/serial
No circuito mostrado na figura 5.6, A,B,C e D_AMP são os 4-bits de sinal que
chegam ao encoder. O conector J4 é a saída para o display.
O encoder U1 recebe dados amplificados (A,B,C,D_AMP) nos PORTs D6 a
D9. O sinal recebido em paralelo é convertido para serial e mandado para o modulo
transmissor RF TXC1 no conector J2 através do PORT DOUT.
Os resistores R1, R2 e RV1 e o capacitor C1 fazem parte do circuito de
oscilação do encoder, sendo que RV1 é um potenciômetro para ajuste.
67
Os PORTs A1 a A5 servem como endereçamento de dados, sendo que neste
caso podem ser todos aterrados.
O conector J3 é a antena do modulo TXC1.
Figura 5.6 – O circuito encoder paralelo/serial.
5.4 O receptor
Para o acionamento individual dos dispositivos externos da placa foi feito uma
seleção digital com portas lógicas a partir dos dados recebidos do módulo receptor
RXD1.
A tabela verdade (5.1) foi gerada a partir dos requisitos de entrada e
apresentada abaixo.
68
Tabela 5.1 – Tabela verdade.
Por fim, a concepção de ligação elétrica para o circuito receptor foi feita como
mostra a figura 5.7.
Figura 5.7 – Concepção de ligação elétrica para o circuito receptor.
69
Nessa concepção, a entrada e a saída do circuito apresentam uma tensão de
24 V. Dessa forma, o circuito receptor pode comunicar-se sem restrições com o
circuito elétrico de controle do circuito eletropneumático, bem como, com as bobinas
das válvulas solenóides que comandam os elementos de trabalho.
O regulador de tensão reduz para 5 V a alimentação do módulo RXD1 e do
circuito da seleção digital.
Os dados recebidos pelo receptor após serem processados são enviados para
as respectivas saídas, de 1 a 8. Esses são os pontos de ligação com as válvulas
solenóides ou com os relés do circuito eletropneumático.
5.5 O circuito receptor
O circuito receptor foi dividido basicamente em três circuitos menores, que
são: o circuito de alimentação, o circuito decoder paralelo/serial e o circuito de
seleção digital.
5.5.1 O circuito de alimentação do receptor
O sistema de alimentação conta com uma entrada de tensão 24V, J1, um
regulador de tensão em U2 para suprir os 5V do circuito digital, e uma distribuição
dos pontos de 24V, J12 a J19 para os dispositivos (onde serão ligados às válvulas
solenóides). O circuito ainda conta com um LED, D6, que indica quando o circuito
está ligado.
A figura 5.8 mostra o circuito elétrico de alimentação do receptor.
70
Figura 5.8 – O circuito elétrico de alimentação do receptor.
5.5.2 O circuito decoder paralelo/serial
O decoder U1, mostrado na figura 5.9, recebe dados de forma serial do
módulo receptor RXD1 (no conector J2), e os transforma novamente em paralelo.
71
Neste ponto os dados são enviados para leds indicadores, D1 (Link Estabelecido),
D2 a D5 (Dados) e para o circuito digital responsável pela seleção das portas de
acionamento.
Figura 5.9 – O circuito decoder paralelo/serial.
O conector J3 é a antena do modulo RXD1, e os pontos A,B,C e D são os 4
bits de sinal que saem do decoder.
U3 é um CI inversor dos bits recebidos, sendo que seus respectivos sinais
invertidos são A/,B/,C/ e D/.
72
5.5.3 O circuito de seleção digital
O circuito é formado por quatro CIs AND, U4 a U7 de quatro entradas que
receberam os bits A,B,C e D e A/,B/,C/ e D/ de forma a acionarem cada saída, de 1+
a 8+, J4 a J11, individualmente.
O circuito conta com um transistor BD131, Q1 a Q8, que funciona como chave
para o dispositivo ligado em seus terminais.
Após a seleção digital dos dados de entrada, um dos conectores, J4 a J11,
estará energizado com tensão de 24 V, a fim de comunicar-se com o circuito elétrico
de controle do circuito eletropneumático.
O circuito de seleção digital é mostrado na figura 5.10.
Figura 5.10 – O circuito de seleção digital.
73
5.6 Os circuitos “Transmissor” e “Receptor”
A figura 5.11 mostra como ficaram os circuitos após seu desenvolvimento.
Na figura 5.11(a), o circuito transmissor (composto pelos circuitos de
alimentação, circuito amplificador de sinal e o circuito encoder paralelo/serial) está
acoplado ao módulo de reconhecimento de voz SR-07, ambos alimentados com 5V
de tensão. Esse conjunto é mantido à distância, situado próximo ao locutor que irá
pronunciar os comandos.
Na figura 5.11(b), o circuito receptor (composto pelos circuitos de alimentação,
circuito decoder paralelo/serial e o circuito de seleção digital) está montado junto aos
conectores de 24V e 0V, que serão ligados às bobinas das válvulas solenóides.
Esse conjunto é mantido próximo ao sistema eletropneumático.
(a) (b)
Figura 5.11 – (a) circuito transmissor; (b) circuito receptor
Conectores (0V)
Conectores (24V)
74
5.7 Simulando um ambiente de independência de locutor
Conforme descrito no capítulo 4, o módulo de reconhecimento de voz SR-07
apresentou um desempenho muito baixo, da ordem de 24,5%, em sistemas
independentes de locutor para palavras treinadas. Já em sistemas dependentes de
locutor, o desempenho do módulo foi bastante satisfatório, principalmente em
ambientes cujo ruído externo apresentou poucas oscilações nas amplitudes das
ondas sonoras, com índice de acertos da ordem de 95,9%.
Diante desses percentuais, tornou-se inviável a utilização do módulo na
categoria de independência de locutor. No entanto, será apresentada nesse item
uma metodologia que consiste em simular um sistema independente de locutor, de
forma que o desempenho do módulo SR-07 seja o de sistema dependente de
locutor.
A fim de exemplificar, podemos considerar dois comandos de voz: o comando
“Início” (que pode significar o início de alguma ação), e o comando “Fim” (que pode
significar o fim dessa ação). Consideremos ainda cinco locutores diferentes, sendo
que todos os locutores farão o treinamento dos comandos “Início” e “Fim” no módulo
de reconhecimento de voz SR-07.
A metodologia consiste nos seguintes detalhes: no treinamento da palavra
“Início” pelo primeiro locutor, o comando será associado ao número “01” do módulo
SR-07, enquanto o comando “Fim”, associado ao número “02”; quanto ao segundo
locutor, o comando “Início” será associado ao número “11”, e o comando “Fim”, ao
número “12”; o terceiro locutor associará aos comandos “Início” e “Fim”, os números
“21” e “22”, respectivamente; o quarto locutor associará aos comandos “Início” e
“Fim”, os números “31” e “32”, respectivamente; finalmente, o quinto locutor
associará aos comandos “Início” e “Fim”, os números “41” e “42”, respectivamente.
Na fase de reconhecimento, qualquer comando realizado por qualquer locutor
caracterizará o sistema de dependência de locutor. No entanto, a metodologia
apresentada se beneficia de uma característica de construção e interceptação do
comando (sinal) pelo circuito elétrico transmissor. O registrador 74LS373 do módulo
SR-07 (figura 3.3) envia o sinal a dois circuitos integrados CI 7448 (sendo um CI
75
para o visualizador das unidades, e outro, para o visualizador das dezenas). A
interceptação do sinal pelo circuito elétrico transmissor nesse trabalho foi feita
apenas no CI 7448 do visualizador das unidades.
Dessa forma, o sinal enviado pelo transmissor referente aos comandos “01”,
“11”, “21”, “31” e “41”, será simplesmente, “1”. Similarmente, o sinal enviado pelo
transmissor referente aos comandos “02”, “12”, “22”, “32” e “42”, será simplesmente,
“2”.
Tecnicamente, a metodologia apresentada caracteriza um sistema de
dependência de locutor, mas que, devido às características de construção dos
circuitos elétricos, é possível simular um sistema de independência de locutor
(restrita nesse exemplo, aos cinco locutores), mantendo alto desempenho do módulo
de reconhecimento de voz SR-07.
76
CAPÍTULO 6: DESENVOLVIMENTO DO CIRCUITO ELETROPNEUMÁTICO
Para a realização dos testes e simulações presentes nesse trabalho, foi
tomado como referência um circuito eletropneumático capaz de atender os requisitos
de automatização de um dispositivo denominado, Silo Alimentador Automático (de
grãos), com o intuito de obter uma sequência de movimentos com aplicação prática.
Nos tópicos seguintes, serão apresentadas as etapas de desenvolvimento
desse circuito.
6.1 Silo Alimentador Automático (de grãos)
O sistema de alimentação (de grãos – adotado nesse trabalho) é um sistema
automático integrado, alimentado por energia pneumática e elétrica.
Princípio de funcionamento: Os recipientes a serem preenchidos com grãos
movem-se sobre a esteira 2 (na direção transversal a representação do esquema).
Uma vez que o sensor de presença capta o correto posicionamento do recipiente,
dá-se o início da sequência dos movimentos. A haste do cilindro B avança, limitando
o medidor de volumes e impedindo a saída dos grãos da bandeja. Logo após, a
haste do cilindro A deve ser recuada para que os grãos ocupem o compartimento
medidor de volume, e avançada em seguida. A haste do cilindro B recua, permitindo
agora que os grãos com um volume pré determinado possa cair até o recipiente. A
seguir, a haste do cilindro C avança, posicionando o recipiente, agora cheio de
grãos, na esteira 3. Logo após, a haste do cilindro C deve recuar, se reposicionando.
O sensor de nível é responsável por “perceber” a necessidade ou não de realimentar
a bandeja.
Para as simulações desse trabalho foi considerada apenas a automatização
dos movimentos dos atuadores lineares pneumáticos.
A figura 6.1 apresenta o esquema de funcionamento do projeto proposto.
77
Figura 6.1 – Esquema de funcionamento do Silo Alimentador Automático
6.2 Diagramas do método seqüencial
O desenvolvimento do circuito eletropneumático do silo alimentador
automático foi realizado utilizando-se o método seqüencial. Para a obtenção das
equações de acionamento dos elementos de trabalho foi feito os diagramas de
movimentos e de acionamentos, conforme apresenta a figura 6.2.
O diagrama trajeto x passo e o diagrama de comando dos atuadores mostram
a sequência dos movimentos dos elementos de trabalho (cilindros pneumáticos) que
atendem ao processo de automatização do silo alimentador automático.
O diagrama de posicionamento dos atuadores mostra a posição dos mesmos
nos diferentes passos do ciclo completo do processo automatizado. A posição
78
Diagrama
Trajeto x Passo
Posicionamento dos
atuadores
Diagrama de atuação
dos sensores
Diagrama de comando
dos atuadores
recuada do cilindro pneumático é representada pelo índice “0”, enquanto, a posição
avançada, representada pelo índice “1”.
Os sensores elétricos ao serem acionados, emitem um sinal informando ao
circuito de controle a posição atual de cada elemento de trabalho. O diagrama de
acionamento dos sensores mostrado na figura 6.2, registra o momento que cada
sensor é acionado, bem como, os passos em que ele se mantém acionado.
Figura 6.2 – Diagramas do método sequencial
79
6.3 Equações de acionamento dos elementos de trabalho
Observando o diagrama de posicionamento dos atuadores (cilindros) na figura
6.2, verifica-se que os passos 1 e 5 possuem a mesma combinação (1,0,0), no
entanto, os acionamentos gerados a partir de cada passo são diferentes. Enquanto
no passo 2 o cilindro “A” deve recuar, no passo 6, é o cilindro “C” quem deve recuar.
O mesmo ocorre com relação aos passos 2 e 4, com combinações iguais
(1,1,0), e nos passos subseqüentes, os acionamentos gerados, também são
diferentes. No passo 3, o cilindro “A” deve avançar, já no passo 5, é o cilindro “C”
quem deve avançar.
Como combinações iguais devem gerar acionamentos iguais, o fato relatado
acima torna-se indesejável. Para solucionar tal situação, será inserido no circuito
outro elemento (relé), com o intuito de diferenciar os passos com mesma
combinação. Os contatos da bobina estarão acionados ou desacionados (1 ou 0),
dependendo do tipo de contato e da energização da bobina no instante considerado.
Por exemplo: Bobina ativada (1 ou K+) – Contato NA fechado (acionado) e, contato
NF aberto (desacionado); Bobina desativada (0 ou K-) – Contato NA aberto
(desacionado) e, contato NF fechado (acionado).
Para a obtenção das equações de acionamento dos elementos de trabalho,
deveriam ser utilizados, a princípio, dois relés para diferenciar os dois pares de
combinações iguais, no entanto, fazendo uma melhor análise na sequência dos
movimentos, constata-se que um único relé é o suficiente para diferenciar as
mesmas combinações.
É importante observar que no método seqüencial, a bobina do relé possui a
mesma função que um atuador, e seus vários contatos possuem a mesma função
que os sensores.
Como as comutações dos relés são muito rápidas, sua representação no
diagrama trajeto x passo é feita em forma de degrau.
A figura 6.3 apresentada a diagramação completa do método seqüencial.
80
Figura 6.3 – Diagramação completa do método sequencial
81
Analisando os diagramas da figura 6.3, podemos obter as seguintes equações
para cada cilindro pneumático:
Cilindro A: O comando do cilindro A será feito por uma válvula direcional
simples piloto.
A+ = b1.KNF e A– = b1.KNF
Cilindro B: O comando do cilindro B será feito por uma válvula direcional duplo
piloto.
B+ = c0.KNF e B– = a1.KNA
Cilindro C: O comando do cilindro C será feito por uma válvula direcional
simples piloto.
C+ = b0.KNA e C– = b0.KNA
6.4 Sistema eletropneumático
O método seqüencial para resolução de circuitos eletropneumáticos nos
permite, com o auxílio das equações de acionamento, visualizarmos com maior
facilidade algumas simplificações de projeto.
82
Nesse caso, foi possível utilizar válvulas direcionais simples solenóide para o
comando dos cilindros A e C.
A figura 6.4 apresenta o sistema eletropneumático do silo alimentador.
Figura 6.4 – Sistema eletropneumático do silo alimentador
6.5 Circuito elétrico de controle
No circuito elétrico de controle foram apresentados dois botões: o botão de
início, responsável por dar início ao ciclo de movimentos, e o botão de emergência,
que está relacionado à segurança do sistema.
Definimos que, nesse projeto, o sistema de segurança refere-se à
despressurização dos cilindros pneumáticos, uma vez acionado o botão de
emergência.
A figura 6.5 apresenta o circuito elétrico de controle do silo alimentador.
83
Figura 6.5 – Circuito elétrico de controle do silo alimentador
O sistema eletropneumático e o circuito elétrico de controle do silo alimentador
automático desenvolvido nesse capítulo sofreram modificações para se adequar às
características funcionais do módulo de reconhecimento de voz SR-07.
Os motivos e as soluções dessas modificações estão descritas
detalhadamente no capítulo seguinte.
84
CAPÍTULO 7: IMPLEMENTAÇÃO DO SISTEMA DE RECONHECIMENTO DE VOZ NO CIRCUITO ELÉTRICO DE CONTROLE
Para a implementação do sistema de reconhecimento de voz no circuito
elétrico de controle, fez-se necessário reconhecer o comportamento do módulo SR-
07, bem como, as características de emissão dos sinais, para a sua adequação
operacional aos circuitos eletropneumáticos. Geralmente os circuitos
eletropneumáticos são projetados da forma mais simplificada possível, desde que
satisfaça todas as exigências de projeto e de segurança. No entanto, é possível que
em muitos casos a adequação do circuito elétrico de controle venha proporcionar
também mudanças nos sistemas eletropneumáticos, tornando-os mais complexos.
É importante observar que quando uma palavra é reconhecida, o módulo SR-
07 envia um determinado sinal. Esse sinal permanece ativo enquanto outra palavra
não seja reconhecida, ou mesmo, enquanto não seja gerado algum código de erro
específico.
Levando-se em conta que a alternância dos comandos realizados pelos
locutores esteja satisfazendo as condições funcionais das sequências de
movimentos dos elementos de trabalho e, que o circuito transmissor e receptor
esteja sincronizado, pode-se concluir então, que as principais mudanças no circuito
elétrico de controle, bem como, em possíveis mudanças nos sistemas
eletropneumáticos, deverá ser tomada no sentido de avaliar o comportamento
operacional do circuito caso o módulo de reconhecimento de voz gere um código de
erro, ou seja, um “comando” inesperado que inevitavelmente desativará o sinal
anterior.
Uma característica importante a ser levada em consideração, é que toda a
comunicação entre esses dois circuitos é realizada por rádio freqüência, ou seja, se
houver disparidade entre o emissor e o receptor, pode haver perda do sinal enviado
pelo último comando reconhecido.
Outra característica do módulo SR-07 que deve ser levada em consideração
diz respeito aos comandos repetidos. Por exemplo, em acionamentos tradicionais
uma mesma válvula de botão (sem retenção) pode ser utilizada para dar início a
várias sequências de operações. No caso do módulo SR-07, a saída do sinal será
85
sempre retentora até a ocorrência de outro comando, ou seja, não ocorrerá
oscilação no sinal emitido ainda que o mesmo comando seja realizado
alternadamente.
Dessa forma, haverá sempre a necessidade de analisar a melhor maneira de
adequação do sistema de reconhecimento de voz nos circuitos eletropneumáticos
para a obtenção favorável dos resultados tanto a nível operacional, quanto a nível de
segurança.
A seguir foi analisada cada proposta de modificação do circuito
eletropneumático original
7.1 Adequação do sistema de segurança (botão de emergência)
No sistema eletropneumático tradicional do silo alimentador foi utilizado uma
válvula direcional (válvula de alimentação) de três vias e duas posições, acionada
por simples solenóide (normalmente aberta), com a finalidade de pressurizar os
elementos de comando.
Adotou-se como sistema de segurança nesse circuito a total despressurização
dos elementos de trabalho (cilindros “A”, “B”, e “C”). Para isso, uma válvula de botão
com trava (botão de emergência) deve ser acionada, energizando “YE”, de modo a
fechar a passagem de ar comprimido aos elementos de comando.
Ao desacionar o botão com trava, a válvula de alimentação retorna a sua
posição normal, os elementos de comando são novamente pressurizados e a
sequência de operação inicia-se de onde havia parado.
86
A figura 7.1 mostra o sistema eletropneumático tradicional descrito no capítulo
anterior.
Figura 7.1 – Acionamento de emergência no sistema eletropneumático
tradicional
Essa solução é bastante prática e eficiente, uma vez que toda a comunicação
com o solenóide “YE” da válvula de alimentação é realizada através do botão de
emergência.
Contudo, para a implementação do módulo de reconhecimento de voz SR-07
no circuito, houve a necessidade de modificar tanto o sistema eletropneumático,
quanto o circuito elétrico de controle.
É importante observar que o comando de voz “emergência” é suficiente para
enviar um sinal ao solenóide “YE”, e mantê-lo ativo. No entanto, qualquer outro
comando de voz, inclusive códigos de erro, desabilita “YE” fazendo com que o
circuito volte a funcionar.
Diante dessa situação, a válvula de alimentação do sistema eletropneumático
foi substituída por outra com acionamento duplo solenóide (válvula de memória),
com o intuito de solucionar a questão descrita acima.
A figura 7.2 mostra o sistema eletropneumático adaptado às características do
módulo SR-07.
87
Figura 7.2 – Adequação no acionamento de emergência do sistema
eletropneumático
Além disso, o circuito elétrico de controle deve garantir que apenas comandos
específicos habilitem e desabilitem a emergência.
A figura 7.3 mostra o circuito elétrico de controle adequado ao sistema
eletropneumático.
Figura 7.3 – Acionamento e desacionamento do sistema de emergência
Dessa forma, somente o comando “pressão” pode habilitar o solenóide “P”, e
somente o comando “emergência” pode habilitar o solenóide “E”. Como a válvula de
alimentação é uma válvula de memória, será sempre o último comando
(“emergência” ou “pressão”) que estará habilitado.
88
Esse procedimento garante que o sistema de emergência não sofrerá
influência de outros comandos, ou mesmo, influência sobre possíveis gerações de
códigos de erros do módulo de reconhecimento de voz SR-07.
7.2 Adequação do sistema de início de ciclo (botão de início)
Com relação ao sistema de partida da sequência de movimentos do silo
alimentador, a adequação ao circuito eletropneumático foi mais trabalhosa, no
entanto, as modificações propostas ocorreram apenas no circuito elétrico de
controle.
A figura 7.4 mostra o circuito elétrico de controle tradicional descrito no
capítulo anterior.
Figura 7.4 – Acionamento de partida do circuito elétrico de controle tradicional
A solução adotada no circuito original foi a de utilizar uma válvula de botão
(sem retenção para ciclo único, ou, com retenção para ciclos contínuos), associada
em série com o sensor “c0” (garantindo que o cilindro “C” esteja recuado) e com o
89
contato fechado da bobina “K”. Com o botão de início acionado ocorre a execução
da sequência dos movimentos dos cilindros pneumáticos, já com o botão
desacionado cessa-se o ciclo após o último movimento (recuo do cilindro “C”). É
importante notar que o início e o término do ciclo de movimentos estão centralizados
numa única ação externa (botão de início).
Na implementação do módulo de reconhecimento de voz no circuito elétrico
de controle foi necessário analisar alguns detalhes.
Primeiro: quando o comando de “início” for reconhecido, a sequência dos
movimentos inicia-se com ciclos contínuos, uma vez que o sinal emitido pelo módulo
SR-07 permanece ativo enquanto outro comando não seja reconhecido. Não há
nenhuma diferença operacional caso o mesmo comando de “início” seja repetido
intermitentemente durante o processo.
Segundo: caso um comando “fim” seja reconhecido, o comando de “início” é
desativado, e o ciclo de operações cessará após o último movimento. O problema, é
que qualquer outro comando diferente de “início” é suficiente para desativá-lo, ou
seja, também pode ser capaz de cessar o ciclo de operações.
Terceiro: caso o módulo de reconhecimento de voz SR-07 detecte uma
palavra não treinada, ou uma palavra muito curta, ou muito longa, será gerado um
código específico de erro, o que também é suficiente para desativar “início”, e
consequentemente cessar o ciclo de operações.
Dessa forma, há necessidade de pensar num sistema que necessariamente
utilize o comando “início” e “fim” para o início e término, respectivamente, do ciclo de
operações.
Afim de garantir que o início e o fim do ciclo de operações sejam realizados
nos momentos corretos, será implementado dois comandos específicos, utilizando-
se uma lógica de auto-retenção.
Quando o comando “início” for reconhecido, o contato fechado da bobina “K2”
permitirá que a bobina “K3” seja ativada, fechando seu contato. Dessa forma, o
solenóide “YB+” será energizado, dando início ao ciclo de operações. Ainda que
outro comando (diferente de “fim”) seja reconhecido, ou mesmo que algum código
de erro seja gerado (desativando “início”), o contato fechado “K3” manterá “YB+”
energizado.
90
Apenas quando o comando “fim” for reconhecido é que a bobina “K2” será
ativada, abrindo seu contato e desativando a bobina “K3”. O contato “K3” aberto
desativará “YB+”, cessando o ciclo de operações.
Dessa forma, somente quando o comando “início” for reconhecido novamente
é que o ciclo de operações reiniciará.
A figura 7.5 mostra o circuito elétrico de controle adaptado às características
do módulo SR-07.
Figura 7.5 – Adequação no acionamento de partida do circuito elétrico de
controle
7.3 Adequação do circuito eletropneumático ao módulo de
reconhecimento de voz SR-07
Quatro comandos do módulo de reconhecimento de voz SR-07 foram
implementados no circuito elétrico de controle. São eles: “início” – para dar início à
sequência do ciclo de operações; “fim” – para cessar o ciclo de operações; “pressão”
– para permitir que os elementos de comando e de trabalho sejam pressurizados;
“emergência” – para acionar o sistema de emergência e segurança do sistema.
91
O sistema eletropneumático e o circuito elétrico de controle adequado ao
módulo SR-07 são mostrados nas figuras 7.6 e 7.7.
Figura 7.6 – Sistema eletropneumático do silo alimentador adequado ao
módulo SR-07
Figura 7.7 – Circuito elétrico de controle do silo alimentador adequado ao
módulo SR-07
92
Com a implementação da lógica de auto-retenção, fica assegurado que os
comandos “início” e “fim” sejam de fato os responsáveis pelo início e término do ciclo
de operações, independentemente de outro comando realizado ou código de erro
gerado, durante a movimentação dos cilindros.
No caso do comando “emergência” ser reconhecido durante a execução do
ciclo de operações, imediatamente todos os cilindros serão despressurizados
(atendendo a condição de segurança imposta nesse caso específico).
Posteriormente, ao ser reconhecido o comando “pressão”, os cilindros serão
realimentados, reiniciando a sequência de operações de onde havia parado.
Excepcionalmente nessa situação, ao término do último movimento, o ciclo será
cessado, e ficará aguardando um novo comando de “início”.
7.4 Testes experimentais na bancada de simulação
Para a validação do projeto foram realizados testes experimentais no
laboratório de pneumática e hidráulica do departamento de Engenharia Mecânica da
Universidade de Taubaté.
Foi utilizada uma bancada de simulação, componentes pneumáticos e
eletropneumáticos produzidos pela Parker, conforme mostra a figura 7.8.
Os comandos “início”, “fim”, “pressão” e “emergência” foram devidamente
treinados no sistema dependente de locutor.
Os testes iniciais foram realizados de forma que o locutor esteve a uma
distância aproximada de 1,5 metros da bancada. Posteriormente essa distância foi
aumentada para aproximadamente 4 metros.
Notou-se que, quando aumentou a distância entre os dois circuitos
(transmissor e receptor) houve uma diferença considerável no tempo entre o
comando propriamente dito e a ação de movimento dos cilindros pneumáticos.
Enquanto nos primeiros testes (1,5 metros de distância) a resposta do sistema não
apresentou retardo significativo, o mesmo não ocorreu nos testes subseqüentes (4
93
metros de distância), chegando a registrar atraso de resposta num tempo em torno
de 3 segundos.
Dessa forma, além do desempenho do circuito eletropneumático estar
diretamente relacionado ao próprio desempenho do módulo de reconhecimento de
voz, está também diretamente relacionado ao desempenho dos circuitos transmissor
e receptor.
Enquanto um baixo desempenho do módulo de reconhecimento de voz pode
ocasionar falha na sequência de operações previstas dos cilindros pneumáticos (no
sentido de não executar uma ação previamente requerida pelo comando), um baixo
desempenho na transmissão e recepção dos sinais de rádio freqüência pode
ocasionar retardos significativos entre o comando e a ação.
Figura 7.8 – Bancada de simulação
94
Observou-se também que quando o módulo SR-07 gerou código de erro a um
determinado comando, o circuito eletropneumático agiu como o previsto, não sendo
influenciado por esse erro. Nesse caso, necessariamente o comando de voz teve
que ser repetido.
Os comentários finais e a conclusão do trabalho serão apresentados no
capítulo seguinte.
95
CAPÍTULO 8: COMENTÁRIOS E CONCLUSÕES
Nesse trabalho foi analisado e implementado um sistema de reconhecimento
de voz num circuito elétrico de controle de um circuito eletropneumático, para que
válvulas de comando pudessem ser acionadas à distância, proporcionando uma
sequência de movimentos pré-estabelecidos em cilindros pneumáticos em função do
comando ativado pela voz.
Todas as etapas dessa implementação foram percorridas, desde a escolha e
obtenção do módulo de reconhecimento de voz que foi utilizado (dando ênfase a
testes experimentais a fim de analisar seu desempenho), passando pela descrição e
desenvolvimento de um circuito eletropneumático (utilizado como modelo de testes e
como ponto de partida para adequação às características do módulo de
reconhecimento de voz), até a adequação propriamente dita entre o módulo e o
circuito elétrico de controle, além de ter projetado dois circuitos elétricos, um
transmissor e um receptor de rádio freqüência (wireless).
Como toda ação do sistema eletropneumático proposto deu-se a partir de
comandos de voz à distância, percebeu-se que o desempenho desse sistema estava
diretamente relacionado ao desempenho do próprio módulo de reconhecimento e da
qualidade de transmissão e recepção desses comandos. Diante desse fato, tornou-
se necessário avaliar o desempenho do módulo SR-07 (módulo de reconhecimento
de voz utilizado), verificando o tipo de ambiente e em qual nível sonoro ele pode ser
submetido, de forma a operar mantendo um nível de eficiência apropriado.
A partir dos resultados obtidos, pôde-se constatar e concluir que o melhor
desempenho do módulo de reconhecimento de voz SR-07 ocorreu nos sistemas
dependentes de locutor, operando em ambientes com variação de nível sonoro entre
50 dB e 65 dB (+/- 3 dB), desde que os ruídos externos não apresentem oscilações
excessivas de pico nas amplitudes das ondas sonoras (com “volume” estável dentro
da faixa de nível sonoro pré-estabelecido), minimizando o efeito de coarticulação. O
desempenho do módulo SR-07 nessas condições foi de 95,9%, entre palavras
treinadas, ou não.
96
Constatou-se ainda que em ambientes com nível sonoro acima de 68 dB, o
módulo SR-07 torna-se totalmente instável e inoperante.
Na categoria de independência de locutor foram constatados os piores
desempenhos, registrando índice de acertos para palavras treinadas de apenas
24,5% em ambientes similares ao descrito acima.
Foi proposta uma metodologia para simular a utilização do módulo SR-07 em
sistemas independentes de locutor, mantendo o desempenho de dependência de
locutor (95,9%). A metodologia baseou-se numa característica de construção do
circuito elétrico transmissor, especificamente onde ocorreu a interceptação do sinal
elétrico enviado ao visualizador digital (junto ao circuito integrado responsável pelo
dígito das unidades do número associado ao comando).
A metodologia permite que locutores diferentes realizem o treinamento dos
mesmos comandos, associando números diferentes aos comandos (desde que o
dígito das unidades do número associado ao comando seja o mesmo). Essa
simulação de independência de locutor é restrita apenas aos locutores que
realizaram os treinamentos.
Desenvolveu-se dois circuitos elétricos (transmissor e receptor) de acordo
com as características técnicas e funcionais tanto do módulo SR-07, quanto do
circuito eletropneumático, com o objetivo de ser o “elo” entre o módulo de
reconhecimento de voz e o circuito elétrico de controle.
Em relação ao circuito eletropneumático, com o intuito de obter uma
sequência de movimentos por parte dos cilindros pneumáticos que não fossem
aleatórios, foi elaborado um modelo que atendesse aos requisitos de automatização
de um silo alimentador automático de grãos, e a partir daí, desenvolvido um circuito,
utilizando-se um método tradicional para resolução de problemas, denominado,
“método seqüencial”.
Como as características funcionais do circuito eletropneumático desenvolvido
tradicionalmente não estavam compatíveis com as características funcionais do
módulo SR-07, foram necessários a realização das devidas adequações. Dessa
forma, foram propostas algumas modificações, em especial, a garantia que apenas
comandos específicos realizassem ações associadas, e que códigos de erros
gerados pelo módulo SR-07 não interferissem na sequência de operações.
97
Montou-se uma simulação na bancada experimental a fim de validar o projeto.
Vários testes com comandos de voz diferentes a diferentes distâncias (entre o
módulo SR-07 e o circuito elétrico de controle) foram realizados obtendo êxito no
resultado final.
Em função dos resultados satisfatórios nas simulações realizadas, conclui-se
que o projeto desenvolvido pode ser perfeitamente utilizado nos processos de
automatização eletropneumáticos do setor industrial, particularmente nas situações
em que tais processos se encaixem nas características técnicas desse projeto.
Evidentemente, melhorias podem ser realizadas, o que certamente produzirá
avanços no desempenho do sistema.
Como sugestões para trabalhos futuros, podem-se citar o desenvolvimento de
um módulo de reconhecimento de voz mais apropriado às configurações
empregadas no setor industrial, visando melhores desempenhos, especialmente
quanto ao efeito de coarticulação, uma vez que ambientes fabris normalmente não
são ambientes silenciosos.
Também poderiam ser estudados metodologias de resolução de problemas
eletropneumáticos, tomando como base as características funcionais do módulo de
reconhecimento de voz adotado, a fim de que o resultado obtido possa ser direto,
sem a necessidade de realizar adequações específicas.
Finalmente, sugere-se que sejam realizadas aplicações práticas em vários
setores, tais como, no próprio setor industrial em geral, na automação predial, em
equipamentos que visem melhorar o cotidiano de pessoas portadoras de
necessidades especiais, ou mesmo, na melhoria do conforto das pessoas em geral,
nos ambientes hospitalares em equipamentos que possam ser automatizados, nas
clínicas (odontológicas, ortopédicas, por exemplo), no setor de entretenimento, nos
parques de diversão, etc.
98
REFERÊNCIAS
1. BOLLMANN, Arno. Fundamentos da Automação Industrial Pneutrônica, projeto de comandos binários eletropneumáticos. São Paulo: ABHP,1997.
2. BONACORSO, N.G., NOLL, V. Automação Eletropneumática. 5a edição. São Paulo: Editora Érica Ltda, 2001.
3. BOYLESTAD, Robert L.; tradução: José Lucimar do Nascimento; revisão técnica: Antonio Pertence Júnior. Introdução a análise de circuitos. 10a Ed. São Paulo: Pearson Prentice Hall, 2004.
4. DIAS, R.S.F., “Normalização de locutor em sistema de reconhecimento de fala”, Dissertação de mestrado – Universidade estadual de camplinas, UNICAMP, Novembro de 2000.
5. FERREIRA, Vicente José Fernandes Costa, “Projeto de um circuito eletropneumático com regulagem da pressão para o processo de execução de furos circulares em chapas metálicas com variação de espessuras”, Artigo – Rev. ciênc. Exatas, Taubaté, v. 13, n. 1, p. 113-120, 2007.
6. FIALHO, A.B. Automação Pneumática – Projetos, Dimensionamento e Análise de Circuitos. 6a edição. São Paulo: Érica, 2007.
7. GUILHOTO, P.J.S., ROSA, S.P.C.S., “Reconhecimento de voz”, Trabalho de síntese no âmbito da licenciatura em engenharia informática – Departamento de engenharia Informática, Universidade de Coimbra, Novembro de 2001.
8. HAYKIN, Simon. Sistemas de comunicação: analógicos e digitais. 4a edição. Porto Alegre: Bookman, 2004.
9. LIMA, A.A., FRANCISCO, S.L., NETTO, S.L., JÚNIOR, F.G.V.R., “Análise comparativa de parâmetros em sistemas de reconhecimento de voz”, XVIII Simpósio Brasileiro de Telecomunicações, 3 a 6 de Setembro, 2000, Gramado-RS.
99
10. MARQUES, Angelo Eduardo B., CRUZ, Eduardo Cesar Alves, JÚNIOR, Salomão Choueri. Dispositivos Semicondutores: Diodos e transistores. 8a Ed. São Paulo: Érica, 2002.
11. MONTEIRO, Luís Carlos Castro, “Reconhecimento de voz: Sistema de reconhecimento do orador, baseado em modelos de Markov, compactado num objecto COM para Windows”, Dissertação de mestrado – Universidade do Minho, Guimarães, 2007.
12. PARKER HANNIFIN TRAINING, Tecnologia Eletropneumática Industrial, Apostila M1002-2 BR, Outubro 2002.
13. RX-D1. “Datasheet”. Modelo RX-D1, fabricante RoHs http://www.spiriton.com.tw/download/RxD1specification.pdf. Acessado em 18 fev. 2011, 16h04 min.
14. SOUZA, Marco Antonio Firmino, “Uma plataforma para a cooperação autônoma de múltiplos robôs”, Dissertação de mestrado – Instituto Militar de Engenharia – IME, Rio de Janeiro, 2008.
15. SR-06/SR-07, Speech Recognition Kit – Construction Manual & User Guide.
16. TEVAH, Rafael Teruszkin, “Implementação de um sistema de reconhecimento de fala contínua com amplo vocabulário para o Português Brasileiro”, Dissertação de mestrado – Universidade federal do Rio de Janeiro, COPPE, Junho de 2006.
17. TOCCI, Ronald J., WIDMER, Neal S., MOSS, Gregory L.; tradução: Cláudia Martins; revisão técnica: João Antonio Martino. Sistemas digitais: princípios e aplicações. 10a Ed. São Paulo: Pearson Prentice Hall, 2007.
18. TX-C1. “Datasheet”. Modelo TX-C1, fabricante RoHs http://www.spiriton.com.tw/download/TX-C1%20specification.pdf. Acessado em 18 fev. 2011, 16h14 min.
19. YNOGUTI, C.A., “Reconhecimento de fala contínua usando modelos ocultos de Markov”, Tese de doutorado – Universidade estadual de Campinas, UNICAMP, Maio de 1999.
100
APÊNDICE A – SISTEMAS ELETROPNEUMÁTICOS
O objetivo desse apêndice é apresentar de forma sucinta uma descrição
acerca das principais características dos sistemas eletropneumáticos, seus
elementos mais comuns, simbologias e funções.
A eletropneumática é uma importante tecnologia dentro do contexto da
automação industrial e precursor da pneumática. O termo pneumática é derivado do
grego Pneumos ou Pneuma (respiração, sopro) e é definido como a parte da Física
que se ocupa da dinâmica e dos fenômenos físicos relacionados com os gases ou
vácuos. É também o estudo da conservação da energia pneumática em energia
mecânica, através dos respectivos elementos de trabalho (PARKER, 2002).
Dessa forma, na eletropneumática, o ar comprimido possui a função de
proporcionar energia aos atuadores pneumáticos a fim de realizarem trabalho.
Como a eletropneumática utiliza uma combinação da energia pneumática com
a energia elétrica, há a necessidade de se ter um circuito elétrico como elemento de
controle. O elemento de controle é um circuito elétrico que combina as informações
fornecidas pelos sensores elétricos juntamente com a sequência de operação,
gerando o acionamento elétrico para os elementos de comando (BONACORSO,
2001).
Estrutura de um sistema eletropneumático
O projeto de um circuito eletropneumático requer um pensamento lógico e a
escolha de uma metodologia de resolução apropriada, em função da natureza de
cada problema.
Num circuito eletropneumático, os elementos de sinal são sensores elétricos
que enviam informações contínuas sobre a evolução do processo automatizado ao
elemento de controle.
101
Os elementos de trabalho são aqueles que efetivamente produzirão
movimentos, sejam rotacionais ou lineares, como por exemplo, motores elétricos,
motores pneumáticos e atuadores (cilindros) pneumáticos. Ao produzirem
movimentos, os elementos de trabalho acionam os elementos de sinal.
Os elementos de comando são os responsáveis por acionarem os elementos
de trabalho, através de válvulas eletropneumáticas pilotadas por solenóides, relés e
contatores.
Os elementos de controle são o próprio circuito elétrico responsável por
acionar os elementos de comando.
Figura A.1 – Diagrama de um circuito eletropneumático automatizado
102
Principais elementos de trabalho que compõem um sistema
eletropneumático
Os principais elementos de trabalho de um sistema eletropneumático são os
cilindros de simples ação, os cilindros de dupla ação e os cilindros rotativos.
Os cilindros de simples ação são componentes pneumáticos caracterizados
por realizarem trabalho apenas no avanço (ou apenas no retorno) da haste do
cilindro. O retorno (ou avanço) da haste é realizado por ação da força de uma mola
posicionado na câmara dianteira (ou traseira) do cilindro.
Tais cilindros são aplicados especialmente em operações que envolvam
fixação, expulsão, extração, prensagem entre outras.
(a) (b)
Figura A.2 – Simbologia do cilindro de simples ação. (a) Retorno por ação de
mola; (b) Avanço por ação de mola.
Os cilindros de dupla ação são componentes pneumáticos caracterizados por
realizarem trabalho tanto no avanço quanto no retorno da haste do cilindro. Esses
cilindros apresentam uma larga aplicação nos setores industriais.
É importante ressaltar que, para uma mesma pressão de trabalho, a força
produzida pelo cilindro nos seus movimentos de avanço e retorno não são iguais (a
força produzida no avanço é normalmente maior que a força produzida no retorno),
103
devido ao fato das áreas efetivas de atuação de pressão serem diferentes, nas
câmaras traseiras e dianteiras do cilindro.
Como o volume de ar comprimido na câmara dianteira do cilindro (com a
haste totalmente recuada), é ligeiramente menor que o volume de ar da câmara
traseira (com a haste totalmente avançada), a velocidade de avanço da haste do
cilindro é normalmente inferior à velocidade de recuo.
Figura A.3 – Simbologia do cilindro de dupla ação
Os cilindros rotativos são cilindros que convertem movimentos lineares em
movimentos rotacionais. A haste do êmbolo do cilindro possui um perfil dentado
acoplado a uma engrenagem. Com o movimento linear da haste, para a direita ou
esquerda, ocorre simultaneamente o movimento rotacional da engrenagem, ora no
sentido horário, ora no sentido anti-horário.
Esse tipo de cilindro é projetado para realizarem rotações (cursos) definidos,
como por exemplo, ângulos de 90o, 180o, 270o, etc.
Figura A.4 – Simbologia do cilindro rotativo
104
Válvulas eletropneumáticas de controle direcional
Nos sistemas eletropneumáticos, as válvulas de controle direcionais são
utilizadas como elemento de comando. Sua função é a de direcionar o fluxo de ar
comprimido, de forma que os elementos de trabalho possam realizar seus
movimentos.
Para um perfeito entendimento das características das válvulas de controle
direcional, é fundamentalmente importante conhecer as seguintes informações:
posição inicial, número de posições, número de vias, tipo de acionamento, tipo de
retorno e vazão. O conhecimento do tipo de construção desses componentes
também é importante, principalmente para uma melhor adequação desta em
diferentes tipos de projetos.
Basicamente, esse tipo de válvula funciona a partir do deslocamento
(comutação) de um núcleo metálico sob a ação de um campo magnético, produzido
pela presença de corrente elétrica no solenóide da válvula.
A seguir, será feito uma breve menção a respeito do funcionamento de
algumas válvulas de controle direcional que compõem um circuito eletropneumático,
identificando sua respectiva simbologia.
Válvula eletropneumática de controle direcional, 3 vias, 2 posições,
simples solenóide, normal fechada (NF)
Trata-se de uma válvula normalmente utilizada para o comando de um cilindro
de simples ação, por possuir apenas uma saída de ar comprimido “A”. Na sua
posição normal (posição de repouso), o ar comprimido que entra em “P”, está
bloqueado.
Ao acionar o solenóide “Y”, ocorre a comutação da válvula (mudança de
posição), e o ar comprimido flui para a saída “A”. Quando o solenóide “Y” perde sua
105
energização, a válvula retorna (por ação da força da mola) à sua posição inicial, e o
ar comprimido que estava em “A” retorna à atmosfera através da conexão “R”.
Figura A.5 – Simbologia da válvula (3/2 vias)
Válvula eletropneumática de controle direcional, 4 vias, 2 posições,
simples solenóide
Trata-se de uma válvula normalmente utilizada para o comando de um cilindro
de dupla ação, por possuir duas saídas de ar comprimido “A” e “B”. Na sua posição
normal (posição de repouso), o ar comprimido que entra em “P”, flui para a conexão
de saída “B”. Além disso, o ar comprimido que estava em “A”, retorna à atmosfera
através da conexão “R”.
Figura A.6 – Simbologia da válvula (4/2 vias)
A
Y
P R
A B
Y
P R
106
Ao acionar o solenóide “Y”, ocorre a comutação da válvula, e o ar comprimido
que está entrando em “P”, flui para a saída “A”. O ar comprimido que estava em “B”,
retorna à atmosfera, também por “R”.
Quando o solenóide “Y” perde sua energização, a válvula retorna (por ação da
força da mola) à sua posição inicial. O ar que estava em “A”, retorna à atmosfera por
“R”, e a conexão “B” se pressuriza novamente.
Válvula eletropneumática de controle direcional, 5 vias, 2 posições,
duplo solenóide
Essa válvula também é normalmente utilizada para o comando de um cilindro
de dupla ação. Quando o solenóide “Y1” é energizado, o ar comprimido que entra em
“P” flui para a conexão “A”, enquanto o ar que se encontrava em “B”, retorna à
atmosfera através de “S”.
Quando o solenóide “Y1” perde sua energização, e “Y2” é energizado, ocorre a
comutação da válvula, e o ar comprimido que entra em “P” flui para a conexão “B”,
enquanto o ar que se encontrava em “A”, retorna à atmosfera através de “R”.
É importante observar que não ocorra energização simultânea nos solenóides
“Y1” e “Y2”.
Figura A.7 – Simbologia da válvula (5/2 vias)
A B
Y1 Y2
R S
P
107
Dispositivos de comando elétrico
São elementos de comutação destinados a permitir ou não a passagem da
corrente elétrica entre um ou mais pontos de um circuito (BONACORSO, 2001).
Os dispositivos de comando elétrico utilizados nos circuitos eletropneumáticos
são normalmente classificados em: elementos de entrada de sinais elétricos,
elementos de processamento de sinais elétricos e elementos de saída de sinais
elétricos.
Elementos de entrada de sinais elétricos
Os elementos de entrada de sinais elétricos são caracterizados por enviarem
sinais (informações) ao circuito mediante a aplicação de força externa, podendo ser
muscular, mecânica, eletrônica ou uma combinação dessas.
Entre os elementos de entrada de sinais elétricos, podem-se destacar: As
botoeiras, que são chaves elétricas acionadas manualmente, e que geralmente
possuem um contato aberto e outro fechado; As chaves fim de curso, que são
comutadores elétricos acionados mecanicamente, geralmente posicionadas no
percurso de cabeçotes móveis; Os sensores de proximidade, que são comutadores
elétricos geralmente posicionados no percurso de cabeçotes móveis. Seu
acionamento não depende de um contato físico entre as partes móveis, bastantando
apenas uma aproximação (a distância de aproximação depende do tipo de sensor
utilizado); E os pressostatos, também conhecido como sensores de pressão, cuja
função é a de registrar tanto o acréscimo, quanto a queda de pressão nas linhas de
pressão.
108
Figura A.8 – Exemplos de elementos de entrada de sinais elétricos e suas
respectivas simbologias. (a) botão pulsador tipo cogumelo, (Parker); (b) chave fim de
curso tipo gatilho, (Parker); (c) sensor capacitivo, (Parker); (d) pressostato, (Parker).
Elementos de processamento de sinais elétricos
Os elementos de processamento de sinais elétricos são caracterizados por
receberem as informações dos elementos de entrada, “analisá-las” e enviá-las aos
elementos de comando, de forma que o comportamento final do sistema se
apresente como o requerido no desenvolvimento do processo de automatização.
(a) (b)
(c) (d)
109
Figura A.9 – Exemplos de elementos de processamento de sinais elétricos e
suas respectivas simbologias. (a) relé auxiliar com contatos comutadores, (Parker);
(b) relé temporizador com retardo na energização, (Parker); (c) contador
predeterminador, (Parker).
Entre os elementos de processamento de sinais elétricos, podem-se destacar:
os relés auxiliares, que são chaves elétricas acionadas por bobinas
eletromagnéticas. Quando a bobina é energizada, ocorre uma inversão imediata nos
seus contatos; Os relés temporizadores, que são também conhecidos como relés de
tempo, são chaves elétricas acionadas por bobinas eletromagnéticas, no entanto,
quando a bobina é energizada, um potenciômetro retarda o acionamento do contato
comutador; Os contatores de potência, que são chaves de comutação
eletromagnética (assim como os relés). No entanto, são dimensionados para
suportarem cargas elétricas elevadas (ao contrário dos relés que suportam cargas
de pequena potência); Os contadores, que são relés contadores programados para
receberem determinada quantidade de pulsos elétricos.
(a) (b)
(c)
110
Elementos de saída de sinais elétricos
Os elementos de saída de sinais elétricos são caracterizados por realizarem
algum tipo de efeito após receberem um sinal previamente processado.
Entre os elementos de saída de sinais elétricos, podem-se destacar: Os
indicadores luminosos, que são normalmente lâmpadas incandescentes ou LEDs;
Os indicadores sonoros, que são normalmente sirenes ou campainhas; Os
solenóides, que são bobinas capazes de gerar um campo magnético quando
energizadas, funcionando como imãs.
Figura A.10 – Exemplos de elementos de saída de sinais elétricos e suas
respectivas simbologias. (a) sinalizadores luminosos e sonoros, (Parker); (b)
solenóides, (Parker).
Metodologias de resolução de circuitos eletropneumáticos
Existem atualmente algumas metodologias utilizadas para a resolução de
circuitos eletropneumáticos. Dentre eles, destacam-se o método intuitivo e o método
seqüencial.
(a) (b)
111
Na técnica de elaboração de circuitos eletropneumáticos pelo método intuitivo
utiliza-se o mecanismo do pensamento e do raciocínio humano na busca da solução
de uma situação-problema apresentada. Dessa forma, pode-se obter diferentes
soluções para um mesmo problema em questão, característica principal do método
intuitivo (PARKER, 2002).
O método seqüencial consiste em definir as equações de acionamento dos
elementos de trabalho, mediante a comparação do diagrama de comando dos
atuadores com o de atuação dos sensores (BONACORSO, 2001).
Dessa forma, utilizando-se o método seqüencial, as soluções encontradas
para um mesmo problema e realizadas por pessoas diferentes, deverão se
apresentar de formas semelhantes.
O diagrama de comando dos atuadores (diagrama Trajeto x Passo) é uma
forma simplifica de representar a ordem dos movimentos, em conformidade com a
sequência requerida pelo projeto em desenvolvimento. O diagrama de atuação dos
sensores representa quais os momentos da sequência dos movimentos, eles
estarão acionados.
112
APÊNDICE B – LAYOUT (CIRCUITO IMPRESSO TRANSMISSOR)
Esse apêndice mostra o layout superior e inferior do circuito impresso do
transmissor.
113
APÊNDICE C – LAYOUT (CIRCUITO IMPRESSO RECEPTOR)
Esse apêndice mostra o layout superior e inferior do circuito impresso do
receptor.
114
ANEXO A – FOLHA DE ESPECIFICAÇÕES DO MÓDULO RX-D1
115
116
ANEXO B – FOLHA DE ESPECIFICAÇÕES DO MÓDULO TX-C1
117
118
119
Autorizo cópia total ou parcial desta obra,
apenas para fins de estudo e pesquisa,
sendo expressamente vedado qualquer tipo
de reprodução para fins comerciais sem
prévia autorização específica do autor.
Vaslei Gil Balmant
Taubaté, março/2011.