Acionamento a distância de circuitos eletropneumáticos por reconhecimento …bdtd.unitau.br/tedesimplificado/tde_arquivos/5/TDE-2012-09... · interceptados por um circuito eletrônico,

UNIVERSIDADE DE TAUBATÉ Vaslei Gil Balmant

Acionamento a distância de circuitos eletropneumáticos por reconhecimento de voz

Taubaté – SP 2011

Vaslei Gil Balmant

Acionamento a distância de circuitos eletropneumáticos por reconhecimento de voz

Dissertação apresentada para obtenção do título de Mestre em Engenharia Mecânica do Departamento de Engenharia Mecânica da Universidade de Taubaté. Área de concentração: Automação Industrial. Orientador: Prof. Dr. José Rui Camargo

Taubaté – SP 2011

VASLEI GIL BALMANT

ACIONAMENTO A DISTÂNCIA DE CIRCUITOS ELETROPNEUMÁTICOS POR RECONHECIMENTO DE VOZ

Dissertação apresentada para obtenção do título de Mestre em Engenharia Mecânica do Departamento de Engenharia Mecânica da Universidade de Taubaté. Área de concentração: Automação Industrial.

Data: _____________________________ Resultado: _________________________

BANCA EXAMINADORA Prof. Dr. José Rui Camargo Universidade de Taubaté Assinatura: __________________________________________________________ Prof. Dr. Álvaro Manoel de Souza Soares Universidade de Taubaté Assinatura: __________________________________________________________ Prof. Dr. Edilson Alexandre Camargo ITA -Instituto Tecnológico de Aeronáutica Assinatura: __________________________________________________________

Dedico este trabalho aos meus pais,

Valmi Balmant e Angela Maria Silva Balmant.

AGRADECIMENTOS

Agradeço a Deus por ter-me proporcionado condições e determinação para

finalizar esse trabalho.

Agradeço a Deus por ter colocado ao meu lado pessoas que me ajudaram,

apoiaram e me incentivaram.

Dentre essas pessoas, meus agradecimentos em especial ao Professor Dr.

José Rui Camargo, por toda ajuda e orientação.

Tudo posso naquele que me fortalece.

Filipenses 4.13

RESUMO

Este trabalho tem como objetivo apresentar os passos iniciais para adequação

entre a tecnologia de reconhecimento de voz e uma tecnologia de automatização de

processos, mais especificamente, a eletropneumática, de forma que o comando do

sistema possa ser realizado através de uma comunicação (voz) à distância.

A implementação do sistema de reconhecimento de voz foi feita em um

circuito elétrico de controle, para que válvulas eletropneumáticas possam ser

acionadas à distância, visando oferecer uma nova opção de comando aos sistemas

de automatização no setor industrial.

Basicamente, os sinais dos comandos treinados pelo módulo de

reconhecimento de voz são enviados a um visualizador digital, onde são

interceptados por um circuito eletrônico, denominado, transmissor. O sinal

interceptado em paralelo é convertido em serial, onde é enviado por rádio freqüência

a outro circuito eletrônico, denominado, receptor. O sinal serial recebido pelo

receptor é novamente convertido em paralelo. Esses sinais (comandos) digitais irão

substituir os comandos musculares convencionais do circuito eletropneumático.

Como o circuito elétrico de controle e o módulo de reconhecimento de voz

possuem características funcionais específicas, há necessidade de realizar

adequações no circuito eletropneumático tradicional, afim de garantir que a

sequência de operações dos elementos de trabalhos sejam realizadas corretamente.

Tais adequações consistem basicamente em garantir que apenas os comandos pré-

determinados executem ações específicas, e que palavras não reconhecidas pelo

módulo, ou códigos de erros, não interfiram no projeto.

Para a avaliação do sistema foram realizados testes numa bancada de

simulação para circuitos eletropneumáticos, utilizando-se um módulo de

reconhecimento de voz para a emissão dos comandos.

Os resultados obtidos após a validação do projeto foram plenamente

satisfatórios.

Palavras-chave: Circuito eletropneumático. Reconhecimento de voz. Comando

a distância.

ABSTRACT

Remote Triggering of electro-pneumatic circuits by voice recognition

This work aims to present the initial steps to adequacy between voice

recognition technology and process automation technology, more specifically, the

electro-pneumatic, so that the control of the system can be achieved through a

remote kind of communication (voice).

The implementation of the recognition of voice system was made in a control

electrical circuit, so that the electro-pneumatic valves can be moved at a distance,

aiming to provide a new option to the automation systems in the industrial sector.

Basically, the signs of controls trained by voice recognition module are sent to

a digital display, in which an electronic circuit called transmitter intercepts them. The

signal intercepted in parallel is converted into serial, where it is sent by radio

frequency to another circuit mail, called receiver. The serial signal received by the

receiver is again converted into parallel. These signals (controls) will replace the

conventional muscle controls circuit of the electro-pneumatic circuit.

As the electrical control circuit and the voice recognition module have specific

functional characteristics, there is a need to carry out adaptations in the electro-

pneumatic traditional circuit, in order to ensure that the operation sequence of the

elements of work be carried out correctly. Such adaptations consist basically in

ensuring that only the pre-determined controls implement specific actions, but also

words not recognized by module, or codes of errors, so that they do not interfere in

the project.

Tests were performed in a simulative workbench for electro-pneumatic circuits,

using a voice recognition module for the control emission as the assessment of the

system.

The results obtained after validation of the project were fully satisfactory.

Key-words: electro-pneumatic circuit. Voice recognition. Remote comand.

LISTA DE FIGURAS

Figura 1.1 – Esquema básico do projeto

Figura 3.1 – Módulo de reconhecimento de voz – SR-07

Figura 3.2 – O circuito SR-07

Figura 3.3 – Diagrama de blocos simplificado do módulo SR-07

Figura 3.4 – Esquema do circuito de reconhecimento de voz SR-07

Figura 5.1 – Os módulos TXC1 e RXD1

Figura 5.2 – Circuito do módulo SR-07 (saída dos displays)

Figura 5.3 – Concepção de ligação elétrica para o circuito transmissor

Figura 5.4 – O circuito elétrico de alimentação do transmissor

Figura 5.5 – O circuito amplificador de sinal

Figura 5.6 – O circuito encoder paralelo/serial

Figura 5.7 – Concepção de ligação elétrica para o circuito receptor

Figura 5.8 – O circuito elétrico de alimentação do receptor

Figura 5.9 – O circuito decoder paralelo/serial

Figura 5.10 – O circuito de seleção digital

Figura 5.11 – (a) circuito transmissor; (b) circuito receptor

Figura 6.1 – Esquema de funcionamento do Silo Alimentador Automático

Figura 6.2 – Diagramas do método seqüencial

Figura 6.3 – Diagramação completa do método seqüencial

Figura 6.4 – Sistema eletropneumático do silo alimentador

Figura 6.5 – Circuito elétrico de controle do silo alimentador

Figura 7.1 – Acionamento de emergência no sistema eletropneumático

tradicional

Figura 7.2 – Adequação no acionamento de emergência do sistema

eletropneumático

Figura 7.3 – Acionamento e desacionamento do sistema de emergência

Figura 7.4 – Acionamento de partida do circuito elétrico de controle

tradicional

Figura 7.5 – Adequação no acionamento de partida do circuito elétrico de

controle

22

32

33

34

35

62

63

64

65

66

67

68

70

71

72

73

77

78

80

82

83

86

87

87

88

90

Figura 7.6 – Sistema eletropneumático do silo alimentador adequado ao

módulo SR-07

Figura 7.7 – Circuito elétrico de controle do silo alimentador adequado ao

módulo SR-07

Figura 7.8 – Bancada de simulação

91

91

93

LISTA DE GRÁFICOS

Gráfico 4.1 – Gráfico de desempenho em sistemas dependentes de

locutor

Gráfico 4.2 – Gráfico de desempenho em sistemas independentes de

locutor

Gráfico 4.3 – Gráfico comparativo entre os sistemas dependentes e

independentes de locutor

54

59

60

LISTA DE TABELAS

Tabela 3.1 – Resultados obtidos no reconhecimento de voz da primeira

simulação

Tabela 3.2 – Resultados obtidos no reconhecimento de voz da segunda

simulação

Tabela 3.3 – Resultados obtidos no reconhecimento de voz da terceira

simulação

Tabela 3.4 – Resultados obtidos no reconhecimento de voz da quarta

simulação

Tabela 4.1 – Descrição da base de dados treinada e testada pelo locutor

1, com ocorrência de coarticulação tipo A


2, com ocorrência de coarticulação tipo A


3, com ocorrência de coarticulação tipo B


4, com ocorrência de coarticulação tipo B

Tabela 4.5 – Descrição da base de dados treinada pelo locutor 1, e

testada aleatoriamente pelos locutores 2, 3 e 4, com ocorrência de

coarticulação tipo A



coarticulação tipo A



coarticulação tipo B



coarticulação tipo B

Tabela 5.1 – Tabela verdade

42

43

44

45

51

51

52

52

55

56

56

57

68

LISTA DE APÊNDICES

APÊNDICE A – SISTEMAS ELETROPNEUMÁTICOS

APÊNDICE B – LAYOUT DO CIRCUITO IMPRESSO (TRANSMISSOR)

APÊNDICE C – LAYOUT DO CIRCUITO IMPRESSO (RECEPTOR)

100

112

113

LISTA DE ANEXOS

ANEXO A – FOLHA DE ESPECIFICAÇÕES DO MÓDULO RX-D1

ANEXO B – FOLHA DE ESPECIFICAÇÕES DO MÓDULO TX-C1

114

116

LISTA DE SIGLAS

A+ Cilindro “A” avançado ou avançando

A- Cilindro “A” recuado ou recuando

a0 Sensor fim de curso (haste do cilindro “A” recuada)

a1 Sensor fim de curso (haste do cilindro “A” avançada)

B+ Cilindro “B” avançado ou avançando

B- Cilindro “B” recuado ou recuando

b0 Sensor fim de curso (haste do cilindro “B” recuada)

b1 Sensor fim de curso (haste do cilindro “B” avançada)

C+ Cilindro “C” avançado ou avançando

C- Cilindro “C” recuado ou recuando

c0 Sensor fim de curso (haste do cilindro “C” recuada)

c1 Sensor fim de curso (haste do cilindro “C” avançada)

CI Circuito Integrado

CLP Controlador Lógico Programável

COM Modelo de Objeto Componente

CPU Central Única de Processamento

CSR Reconhecimento de Fala Contínua

dB Decibels

DTW Ajuste Temporal Dinâmico

E Emergência

HMM Modelo Oculto de Markov

K Relé

K2 Relé 2

K3 Relé 3

K+ Bobina do relé ativada

K- Bobina do relé desativada

KNA Contato do relé (normalmente aberto)

KNF Contato do relé (normalmente fechado)

NA Normalmente aberta

NF Normalmente fechada

P Pressão

RF Rádio Frequência

SR-07 Reconhecedor de voz (modelo 07)

YA- Válvula solenóide (recuo do cilindro “A”)

YB+ Válvula solenóide (avanço do cilindro “B”)

YB- Válvula solenóide (recuo do cilindro “B”)

YC+ Válvula solenóide (avanço do cilindro “C”)

YE Válvula solenóide (acionamento de emergência)

SUMÁRIO

1. INTRODUÇÃO

1.1. Justificativa

1.2. Objetivo

1.3. Desenvolvimento do trabalho

1.4. Revisão de literatura

2. NOTAS HISTÓRICAS

2.1. Evolução dos sistemas de comunicações

2.2. Evolução dos sistemas de automatização eletropneumática

3. O MÓDULO DE RECONHECIMENTO DE VOZ

3.1. O circuito integrado de reconhecimento de voz HM2007

3.2. Categorias dos sistemas de reconhecimento de voz

3.2.1. Sistemas dependentes

3.2.2. Sistemas independentes

3.3. Estilos de reconhecimento

3.4. Treinamento de palavras para serem reconhecidas

3.5. Testando o reconhecimento das palavras treinadas

3.6. Apagando os dados da memória

3.7. Testando o módulo de reconhecimento de voz SR-07

3.7.1. Primeira simulação

3.7.2. Segunda simulação

3.7.3. Terceira simulação

3.7.4. Quarta simulação

3.8. Análise dos resultados do teste de reconhecimento de voz

19

19

20

20

23

27

27

29

32

35

36

37

37

38

39

39

40

40

42

42

43

44

45

3.8.1. Análise dos resultados obtidos pelo sistema dependente

de locutor

3.8.2. Análise dos resultados obtidos pelo sistema

independente de locutor

4. ANÁLISE DE DESEMPENHO DO MÓDULO DE

RECONHECIMENTO DE VOZ SR-07 COM IMPLEMENTAÇÃO DO

EFEITO DE COARTICULAÇÃO

4.1. Metodologia utilizada

4.2. Análise comparativa de sistemas dependentes de locutor

com ocorrência de coarticulação

4.3. Resultados do sistema dependente de locutor

4.4. Análise comparativa de sistemas independentes de locutor

com ocorrência de coarticulação

4.5. Resultados do sistema independente de locutor

4.6. Comparativo entre os sistemas dependentes e


5. O CIRCUITO ELÉTRICO

5.1. O método de transmissão

5.2. O transmissor

5.3. O circuito transmissor

5.3.1. O circuito de alimentação do transmissor

5.3.2. O circuito amplificador de sinal

5.3.3. O circuito encoder paralelo/serial

5.4. O receptor

5.5. O circuito receptor

46

46

48

49

50

53

55

57

60

61

61

62

64

65

65

66

67

69

5.5.1. O circuito de alimentação do receptor

5.5.2. O circuito decoder paralelo/serial

5.5.3. O circuito de seleção digital

5.6. Os circuitos “Transmissor” e “Receptor”

5.7. Simulando um ambiente de independência de locutor

6. DESENVOLVIMENTO DO CIRCUITO ELETROPNEUMÁTICO

6.1. Silo Alimentador Automático (de grãos)

6.2. Diagramas do método seqüencial

6.3. Equações de acionamento dos elementos de trabalho

6.4. Sistema eletropneumático

6.5. Circuito elétrico de controle

7. IMPLEMENTAÇÃO DO SISTEMA DE RECONHECIMENTO DE

VOZ NO CIRCUITO ELÉTRICO DE CONTROLE

7.1. Adequação do sistema de segurança (botão de emergência)

7.2. Adequação do sistema de início de ciclo (botão de início)

7.3. Adequação do circuito eletropneumático ao módulo de

reconhecimento de voz SR-07

7.4. Testes experimentais na bancada de simulação

8. COMENTÁRIOS E CONCLUSÕES

REFERÊNCIAS


APÊNDICE B – LAYOUT (CIRCUITO IMPRESSO TRANSMISSOR)

APÊNDICE C – LAYOUT (CIRCUITO IMPRESSO RECEPTOR)



69

70

72

73

74

76

76

77

79

81

82

84

85

88

90

92

95

98

100

112

113

114

116

19

CAPÍTULO 1: INTRODUÇÃO

1.1 Justificativa

Há algumas décadas atrás, o reconhecimento de voz era visto por muitos

apenas como obra de ficção científica, talvez como HAL - 9000, o cérebro eletrônico

que interagia com seu operador no filme: 2001, A space Odissey, dirigido por

Stanley Kubrick, em 1968, nos EUA.

Contudo, desde a década de 50, instituições de pesquisa analisam maneiras

para que a voz possa ser processada e interpretada por computadores. No entanto,

é a partir de meados da década de 90 que começam a surgir as primeiras

aplicações utilizando a tecnologia de reconhecimento de voz, sendo que, a cada

nova aplicação que surge, a consolida comercialmente.

Hoje em dia, essa forma de automatização possui inúmeras aplicações, em

especial, no setor de entretenimento e informação, como por exemplo, a discagem

ativada por voz, a checagem de e-mails via telefone ou celular, o acesso a agendas

e serviços bancários (ou quaisquer outros serviços que registrem e consultem

informações em base de dados).

Por outro lado, com relação ao setor industrial, há algumas décadas têm-se

utilizado tecnologias como a hidráulica, a pneumática, a eletropneumática e o CLP

em seus sistemas e processos de automatização. Para o acionamento e controle

desses sistemas são normalmente utilizados válvulas hidráulicas ou pneumáticas

com acionamentos musculares ou mecânicos, sinais elétricos em válvulas

eletromecânicas, além dos mais diversos tipos de sensores.

Embora não tenha ainda uma aplicação específica no setor industrial, esse

trabalho apresentou os passos iniciais para adequação entre a tecnologia de

reconhecimento de voz e uma tecnologia de automatização de processos, mais

especificamente, a eletropneumática, de forma que o controle do sistema possa ser

realizado através de comando de voz à distância. A comunicação envolve

20

implicitamente a informação transmitida de um ponto a outro por uma sucessão de

processos (Haykin, 2004).

Espera-se que, oportunamente, sistemas como o proposto nesse trabalho

possam ser utilizados no setor produtivo industrial, até mesmo por pessoas com

deficiências físicas, ou mesmo no controle de processos de alto risco com foco em

segurança.

1.2 Objetivo

Esse trabalho possui como objetivo principal a implementação e adequação

de um sistema de reconhecimento de voz num circuito elétrico de controle, para que

válvulas eletropneumáticas possam ser acionadas à distância, visando oferecer uma

nova opção de comando aos sistemas de automatização no setor industrial.

1.3 Desenvolvimento do trabalho

Para o desenvolvimento desse trabalho foram elaboradas quatro etapas: a

primeira etapa tratou de escolher e obter um módulo de reconhecimento de voz, que

foi responsável por capturar e interpretar os sons analógicos emitidos pelas cordas

vocais humanas e transformá-las em sinais elétricos digitais compreensíveis aos

circuitos eletrônicos. Nessa etapa ainda, foram realizadas centenas de testes com a

finalidade de avaliar o desempenho do módulo escolhido em diferentes ambientes

de trabalho. Além disso, apesar de serem muitos os fatores que interfiram nos

processos de captação e reconhecimento da voz, uma atenção muito especial foi

dada à verificação do limite da influência dos sons externos no desempenho do

sistema. Foram realizados testes em ambientes com maiores e menores oscilações

21

na amplitude das ondas sonoras, com variação específica de nível sonoro.

Finalmente, foram definidos os ambientes e as condições mais apropriadas para que

o percentual de acertos do módulo de reconhecimento de voz se mantivesse num

nível elevado e aceitável aos processos de automatização proposto.

A segunda etapa foi destinada ao desenvolvimento de dois circuitos

eletrônicos, sendo um transmissor e um receptor de rádio freqüência, permitindo que

os comandos fossem realizados à distância. Posteriormente, foi desenvolvido um

circuito eletropneumático convencional que atendesse ao processo de

automatização de um silo alimentador automático. Esse circuito foi muito importante

no tocante a servir como modelo de testes, bem como, utilizá-lo como ponto de

partida para que pudesse ser adequado às características do módulo de

reconhecimento de voz. Para obtenção do circuito eletropneumático foi utilizado o

método seqüencial, uma vez que, intuitivamente projetistas diferentes certamente

encontrariam soluções diferentes para o mesmo problema. Dessa forma, a escolha

do método seqüencial foi no intuito de padronizar a solução obtida por diferentes

projetistas, a partir das equações de acionamentos dos elementos de trabalho.

Na terceira etapa foi realizado todo o tratamento de adequação das

características do módulo de reconhecimento de voz ao circuito elétrico de controle

e ao sistema eletropneumático, sendo que, todas as modificações necessárias foram

criteriosamente analisadas e comentadas.

Na quarta etapa foram realizados testes experimentais, desde o treinamento

dos comandos isolados no módulo de reconhecimento de voz SR-07, até a

observação funcional da sequência de operações do circuito eletropneumático, afim

de que todo o projeto fosse validado. Todas as considerações finais foram

comentadas, dando ênfase à aplicabilidade do sistema proposto aos processos de

automatização industrial.

Esse trabalho conta ainda com um apêndice, destinado aos circuitos

eletropneumáticos, enfatizando em primeiro lugar a sua importância no cenário da

automação industrial, analisando sua estrutura lógica e verificando os principais

elementos que compõem esse circuito.

Na figura 1.1 está representado o esquema básico do projeto.

22

Figura 1.1 – Esquema básico do projeto

O microfone, o módulo de gravação de voz, o teclado, o visualizador digital e

a programação fazem parte do módulo de reconhecimento de voz.

O circuito transmissor (desenvolvido a partir do sinal de saída do módulo de

reconhecimento de voz) e o circuito receptor são descritos detalhadamente no

capítulo 5.

O circuito elétrico de controle, o sistema eletropneumático e as adequações

necessárias são descritas detalhadamente nos capítulos 6 e 7.

23

1.4 Revisão de literatura

Para a execução deste trabalho foram realizadas várias pesquisas. A seguir,

um resumo dos assuntos das principais obras consultadas:

DIAS (2000) utilizou uma técnica de normalização de locutor com o intuito de

avaliar um sistema de reconhecimento de fala de vocábulo flexível (um vocábulo

formado por qualquer palavra de um mesmo idioma e não correlacionado com a

base de dados utilizado no treinamento do sistema). A técnica de normalização de

locutor adotada foi a de escalonamento (“warping”) do eixo de freqüências, por

tratar-se de uma técnica que tem apresentado bons resultados na normalização do

trato vocal.

Fez uma introdução sobre os sistemas de reconhecimento de fala e suas

restrições, além de ter descrito os modelos ocultos de Markov (Hidden Markov

Models) e suas aplicações em reconhecimento de fala.

Descreveu a base de dados e o ambiente específico de simulações,

apresentou o sistema de reconhecimento de fala flexível utilizado, e descreveu as

etapas do processo, tais como, extração de parâmetros, treinamento e

reconhecimento.

Finalmente apresentou a avaliação do sistema de reconhecimento de fala

utilizando normalização de locutor, bem como, suas devidas conclusões.

FERREIRA (2007) apresentou uma proposta de execução de um circuito

eletropneumático, com a finalidade específica de monitorar a pressão de um atuador

pneumático num processo de furação, em função da variação da espessura de

chapas metálicas.

No circuito eletropneumático proposto, empregou a tecnologia CLP

(controlador lógico programável), controlando uma válvula reguladora de pressão, a

partir de um sinal de entrada de um sensor elétrico.

Concluiu que em aplicações industriais similares, o controle do sistema pode

ser administrado em função do reconhecimento do tipo de espessura de chapa,

sendo possível um ganho de produtividade.

24

LIMA et AL (2000) realizaram análises comparativas de diversos parâmetros

em sistemas de reconhecimento de voz para palavras isoladas, tanto em sistemas

dependentes de locutor, quanto em sistemas independentes de locutor.

Verificaram a influência de parâmetros como o tamanho do codebook, o

número de estados, o número de coeficientes cepstrais por segmento, o tamanho da

superposição das janelas e o tamanho das janelas em sistemas baseados nos

“Modelos Ocultos de Markov” – (Hidden Markov Models – HMMs), no intuito de

avaliar o desempenho do sistema a partir do percentual do índice de acertos.

Obtiveram resultados de simulações realizadas com diferentes algoritmos de

extração de coeficientes mel-cepstrais a partir de um sistema com ajuste temporal

dinâmico – (dynamic time warping – DTW).

MONTEIRO (2007) descreveu a implementação de um sistema de

reconhecimento de orador, com o objetivo principal de transferir a tecnologia dos

meios científicos para a comunidade.

O sistema de reconhecimento de orador foi baseado em HMM (Hidden Markov

Models) e implementado em C++ (linguagem de programação), utilizando a

ferramenta computacional Visual C++, sendo inserido num objeto COM (Component

Object Model) para Windows.

A partir da criação do objeto COM, converteu-se a implementação num

software dinâmico, ou seja, um sistema com capacidade de ser interligado com

qualquer outro software que necessite de reconhecimento de voz.

Finalizando, avaliou o desempenho do sistema proposto numa base de dados,

considerando-se palavras pronunciadas isoladamente.

SOUZA (2008) utilizou um jogo de futebol de robôs como uma plataforma

experimental para o desenvolvimento do seu trabalho.

Estudou os times envolvidos numa determinada competição, bem como, suas

técnicas empregadas, mas sobretudo, implementou os requisitos necessários para o

pleno funcionamento de uma equipe, incluindo a construção de circuitos eletrônicos,

além do desenvolvimento de um sistema para planejamento e tomada de decisão.

Desenvolveu ainda um sistema de comunicação robusto, necessário para

estabelecer corretamente a transmissão de dados de um computador central aos

robôs em campo.

25

Os módulos de comunicação adotados foram o par TXC1 (transmissor) e

RXD1 (receptor). O circuito transmissor foi acoplado num computador de controle e

os circuitos receptores nos robôs, de forma que cada transmissor enviasse dados a

até cinco receptores (robôs).

Desenvolveu ainda uma máquina de conhecimento que atua como “técnico”

detectando como deve ser a atuação dos times em campo.

TEVAH (2006) descreveu a implementação de um sistema CSR (continuous

speech recognition) com amplo vocabulário para o português brasileiro baseado em

pacotes disponíveis na internet.

Estudou várias técnicas utilizadas pelos sistemas de fala contínua. Algoritmos

de busca foram tratados detalhadamente, além de ter adaptado a metodologia que

utiliza modelos acústicos e lingüísticos no reconhecimento de fala para o português

brasileiro. Fez uma proposição de algoritmo para conversão de sequência fonética

em texto.

Desenvolveu uma base de dados a fim de viabilizar os testes, e obteve curvas

que relacionam variáveis conhecidas em sistemas CSR, como: taxa de acertos de

palavras, perplexidade, diferentes modelos de linguagem, complexidade

computacional, tamanho do vocabulário, etc.

Vários testes foram realizados fazendo variar os principais parâmetros

utilizados em fala contínua.

YNOGUTI (1999) estudou a questão do reconhecimento de fala contínua em

sistemas independentes de locutor e vocábulo médio, utilizando os “Modelos Ocultos

de Markov”. Investigou a influência de alguns conjuntos de sub-unidades fonéticas, e

os modelos de duração e de linguagem no desempenho do sistema, e propôs alguns

métodos de redução no tempo de processamento nos algoritmos de busca.

Fez uma abordagem acerca dos problemas do reconhecimento da fala,

especificando sua arquitetura e unidades fundamentais, os modelos de duração de

palavras, algoritmos de decodificação e modelos de linguagem.

Analisou ainda a estrutura e os tipos dos “Modelos Ocultos de Markov” para a

sua utilização em treinamentos e algoritmos de busca.

Apresentou o sistema desenvolvido, onde utilizou o módulo de extração de

parâmetros e quantização vetorial, o módulo de treinamento, o módulo de geração

do modelo de linguagem e o módulo de reconhecimento.

26

Finalmente testou e analisou os resultados, avaliou o procedimento proposto

para diminuição do tempo de processamento, e realizou suas conclusões.

Após a realização da revisão de algumas literaturas disponíveis, torna-se

importante uma breve descrição acerca desse trabalho.

Muitos autores trataram detalhadamente a questão da variabilidade da fala e

influências sonoras externas no desempenho do sistema de reconhecimento de voz,

além de apresentarem técnicas que visam melhorias desse desempenho.

Muitos outros autores trataram a questão de processos de automatização

industrial e suas mais diversas aplicações, utilizando tecnologias como a

eletropneumática, CLP, pneutrônica e outras.

O diferencial deste trabalho foi a junção de duas tecnologias diferentes,

particularmente na implementação de um sistema de reconhecimento de voz em

circuitos eletropneumáticos intermediados por circuitos eletrônicos, proporcionando

uma nova opção de comando aos sistemas automáticos, seja no setor industrial, no

setor de automação predial, no conforto para pessoas portadoras de deficiências

físicas, no auxílio em sistemas automáticos hospitalares ou em clínicas

odontológicas, etc.

27

CAPÍTULO 2: NOTAS HISTÓRICAS

O desenvolvimento desse trabalho deu-se a partir de um contexto onde as

tecnologias de comunicações e de automatização industrial possuem vastas

aplicações nos mais diversos setores.

No entanto, é fundamentalmente importante analisar e entender a evolução

histórica das tecnologias que presenciamos hoje.

Dessa forma, esse capítulo foi destinado a um breve histórico relacionado a

datas e eventos inerentes à evolução dos sistemas de comunicações, bem como, a

evolução dos sistemas de automatização eletropneumática.

2.1 Evolução dos sistemas de comunicações

Segundo Haykin (2004) a evolução dos sistemas de comunicações deu-se

como segue:

Samuel Morse desenvolveu, em 1835, um sistema de representação de letras,

números e sinais de pontuação que são decodificados e enviados

intermitentemente, denominado código morse. Mais tarde, em 1837, o mesmo

Samuel Morse criou o telégrafo elétrico – importante meio de comunicação à

distância, e precursor das comunicações digitais.

Em 1864, James Clerk Maxwell apresentou uma teoria detalhada à cerca da

natureza eletromagnética da luz (hipótese anteriormente proposta por Michael

Faraday). Além disso, Maxwell também teria previsto a existência das ondas de

rádio, sendo que, em 1887, foram estabelecidas experimentalmente por Heinrich

Hertz.

Em 1875, o professor de surdos, Alexander Graham Bell, inventou um

aparelho capaz de transmitir e reproduzir sons em tempo real através da codificação

elétrica, o telefone.

28

Em 1894, Oliver Lodge demonstrou a comunicação sem fio a curta distância,

e em 1901, Guglielmo Marconi recebeu um sinal de rádio que se originara na

Inglaterra, 2.720 km através do Atlântico. Dessa forma, o caminho estava aberto

para uma enorme evolução das comunicações.

Em 1906, Reginald Fessenden, um acadêmico autodidata, realizou a primeira

transmissão de rádio.

Em 1928, Philo T. Farnsworth, e em 1929, Vladimir K. Zworykin,

demonstraram os primeiros sistemas de televisão totalmente eletrônico.

Durante a II guerra mundial, Alec Reeves desenvolveu uma técnica capaz de

codificar digitalmente os sinais analógicos da voz, cujo intuito era o de criptografá-la.

Em 1948, Claude Shannon publicou um artigo intitulado “A Mathematical

Theory of Communications”, onde são lançados os alicerces teóricos das

comunicações digitais.

A natureza do processamento de sinais e o setor de telecomunicações foram

profundamente modificados a partir da invenção do transistor, em 1948, por Walter

H. Brattain, John Bardeen e William Shockley. Mais tarde, em 1958, Robert Noyce

produz o primeiro circuito integrado, abrindo as portas para o posterior

desenvolvimento dos circuitos integrados em escala muito alta (VLSI), e dos

microprocessadores.

Em 1945, Arthur C. Clark teve a idéia de utilizar um satélite em órbita na Terra

como um ponto de comutação para comunicações entre suas estações na Terra, e

em 1955, John R. Pierce sugeriu a utilização de satélites para comunicações.

Em 1957, a União Soviética lançou o Sputnik 1, o qual transmitiu sinais de

telemetria por 21 dias. Pouco depois, em 1958, os estados Unidos da América

lançaram o Explorer 1, o qual transmitiu por quase 5 meses sinais de telemetria. No

entanto, o passo experimental mais notável na tecnologia de comunicações por

satélite, foi em 1962, com o lançamento do Telstar 1, que era capaz de retransmitir

programas de TV através do Atlântico.

Em 1966, K. C. Kap e G. A. Hockham deram um passo importante com

relação às comunicações ópticas, propondo a utilização de fibra de vidro revestida

como guia de onda dielétrico.

29

Durante a década de 50, os computadores e terminais começaram a

comunicar-se entre si em longas distâncias, utilizando-se de canais telefônicos de

banda de voz operando em baixas velocidades (300 a 1200 b/s).

Ainda no final da década de 50, surgem as primeiras pesquisas tecnológicas

para o reconhecimento de voz, no entanto, apenas na década de 90 é que essa

tecnologia se incorpora comercialmente, com o lançamento do primeiro software

para reconhecimento de voz, o IBM Personal Dictation System, para OS/2, em 1993.

Entre 1950 e 1970 foram realizados vários estudos à cerca de redes de

computadores, sendo o mais significativo em termos de impacto sobre as

comunicações por computador, a ARPANET, que entrou em vigor em 1971.

Em 1985, a ARPANET foi renomeada como Internet. Em 1990, Tim Berners-

Lee, propôs uma interface de software hipermídia para a internet, a qual passou a se

chamar World Wide Web.

Conforme pôde-se observar no breve histórico realizado acima, os grandes

avanços da microeletrônica, dos computadores digitas e dos sistemas ópticos são

responsáveis diretos pelas mudanças no cenário das telecomunicações.

2.2 Evolução dos sistemas de automatização eletropneumática

Conforme relata Bollmann (1997), a utilização do ar como forma de

transmissão de energia é uma técnica muito antiga. Documentos apontam que foi no

primeiro século depois de Cristo, no Egito, que o alexandrino Heron a utilizou pela

primeira vez. Trata-se de um dispositivo para a abertura de um templo. Heron,

utilizou-se do ar aquecido pelas chamas do templo, o qual pressurizava um

recipiente subterrâneo contendo água, provocando uma dilatação e escoamento de

parte dela para outro recipiente, que por sua vez, movia as portas. Dessa forma,

portanto, as portas do templo ficavam “automaticamente” abertas, enquanto

permanecessem acesas as chamas sagradas no interior do altar.

30

É de Heron também, o primeiro registro à cerca da construção de um

reservatório de ar comprimido, objetivando a uniformização da pressão e do fluxo de

ar.

Já no terceiro século depois de Cristo, cita-se um dispositivo construído pelo

mecânico Ctesíbios, também em Alexandria, o qual utilizava a força do ar para

auxiliar no acionamento de um órgão de água. Conhecem-se também, alguns

esboços de máquinas movidas a ar, construídas por Arquimedes.

No entanto, apenas no século XVII é que surgem novas aplicações em torno

da utilização do ar.

Blaise Pascal, em 1663, publicou seus trabalhos sobre a multiplicação de

forças baseada na distribuição homogênea da pressão estática. Mais tarde, a prensa

hidráulica tornou-se a principal aplicação do “Princípio de pascal”.

Já o físico Denis Papin, em 1667, tratou da geração de forças pela diferença

da pressão em torno de corpos no interior de dutos e da possibilidade da sua

utilização para o transporte rápido dos mesmos. Através dos princípios de Papin,

revistos por Medhurst em 1810, chegaram a existir na Inglaterra, locomotivas

movidas a ar, em meados do século XIX.

Outros registros informam-nos da utilização do ar como forma de transmissão

de energia, embora seja apenas no século XIX que o estudo do comportamento e

propriedades do ar, tornou-se efetivamente sistemático, e a pneumática começa

então, ao lado da hidráulica e da eletricidade, a integrar e compor o meio industrial.

Com o crescimento e incorporação da microeletrônica e da informática nos

equipamentos mecânicos, houve também uma reformulação nos comandos

puramente a ar comprimido, de forma que as várias combinações dessas

tecnologias juntamente com a própria pneumática, reúnem vantagens específicas,

acarretando seu crescente uso em automação industrial.

Segundo Fialho (2007), a eletropneumática é o ramo da pneumática que

passa a utilizar a energia elétrica CC ou CA como fonte de energia para o

acionamento de válvulas direcionais, compondo assim as chamadas eletroválvulas e

válvulas proporcionais, energizando ainda sensores magnéticos de posicionamento,

pressostatos, micro-switchs, etc.

31

É, portanto, na intersecção entre a pneumática (responsável basicamente pela

execução de trabalho), e a incorporação entre as várias funções da eletrônica

(responsável pelo controle dos sistemas), que surge a eletropneumática.

Hoje em dia, a eletropneumática está diretamente incorporada às redes de

comunicação digital, tais como, Profibus, DeviceNet, Interbus, Asi-Bus, entre outras.

32

CAPÍTULO 3: O MÓDULO DE RECONHECIMENTO DE VOZ

Para o desenvolvimento experimental desse projeto, o módulo de

reconhecimento de voz escolhido foi o Speech Recognition Kit SR-07, atualmente

comercializado nos Estados Unidos. A escolha desse módulo deu-se em função de

possuir algumas características compatíveis com o projeto que foi desenvolvido,

dentre as quais, podem-se citar: primeiro, é um módulo capaz de reconhecer

palavras em qualquer idioma, desde que seja corretamente “treinado” para isso;

segundo, possui uma grande vantagem que é a sua capacidade de operar

independentemente, uma vez que a maioria dos sistemas de reconhecimento de voz

disponíveis são sistemas que necessitam de computadores para serem operados;

terceiro, é um módulo compacto e com custo relativamente baixo.

A figura 3.1 mostra o módulo de reconhecimento de voz SR-07 (Speech

Recognition Kit SR-07).

Figura 3.1 – Módulo de reconhecimento de voz – SR-07

33

O módulo de reconhecimento de voz SR-07 utiliza três placas de circuito

separadas, conforme mostra a figura 3.2. Uma placa do circuito principal, uma placa

para o teclado e outra placa para o visualizador digital.

Figura 3.2 – O circuito SR-07

Na placa do circuito principal estão instalados o circuito integrado de

reconhecimento de voz HM2007, a memória do circuito (8K x 8 SRAM), e um latch

de saída, implementado com o registrador 74LS373. Este CI armazena o último

comando reconhecido ou treinado, ou ainda códigos de erro do sistema.

Encontram-se também o interruptor liga/desliga, um regulador de voltagem e o

conector para o microfone.

Tanto o teclado quanto o visualizador digital possuem comunicação com o

programa do CI HM2007.

34

O teclado possui doze teclas, sendo dez teclas para os números “0” a “9”,

além das teclas “CLR”, utilizada para apagar as informações da memória, e a tecla

“TRN”, utilizada para a realização do treinamento no reconhecimento das palavras.

Na placa do visualizador digital são instalados dois circuitos integrados CI

7448 (sendo um para cada visualizador), responsável por receber o sinal digital em

paralelo, processá-lo e enviá-lo ao respectivo visualizador.

O módulo de reconhecimento de voz SR-07 possui também um microfone

acoplado, o qual é responsável pela captação do som, além de uma bateria de 9V.

A figura 3.3 mostra um diagrama de blocos simplificado do módulo de

reconhecimento de voz SR-07.

Figura 3.3 – Diagrama de blocos simplificado do módulo SR-07

35

3.1 O circuito integrado de reconhecimento de voz HM2007

O circuito integrado HM2007, mostrado na figura 3.4, contém entrada

analógica de sinal, análise de voz, programação e um sistema de controle de

funções.

Figura 3.4 – Esquema do circuito de reconhecimento de voz SR-07

Possui ainda dois modos de operação, modo manual e modo de CPU.

O modo manual (que foi utilizado nesse projeto) não necessita de um

computador para operá-lo, possibilitando a sua utilização separadamente, e

podendo ser integrado a outros dispositivos eletrônicos.

O modo CPU é uma abordagem atraente para o reconhecimento de voz para

computadores, uma vez que o CI HM2007 funciona como um co-processador para o

processador principal.

Os processos de captação e reconhecimento do som são realizados

independentemente pelo CI HM2007, não havendo necessidade de processamento

do processador principal.

36

Apenas quando o CI HM2007 reconhece um comando válido, é que há uma

sinalização ao processador principal da CPU, o qual fará uso de acordo com sua

programação específica.

O circuito integrado de reconhecimento de voz HM2007 que está inserido no

circuito SR-07 fornece ainda as opções de operar tanto nos sistemas de

reconhecimento de palavras isoladas quanto nos sistemas de reconhecimento de

palavras conectadas, em função do tempo de pronunciamento de cada uma delas.

Nos sistemas de reconhecimento de palavras isoladas, a capacidade do chip

é de 40 palavras com duração máxima de 0,96 segundos, enquanto, nos sistemas

de reconhecimento de palavras conectadas, a capacidade do chip é de 20 palavras,

com duração máxima de 1,92 segundos.

3.2 Categorias dos sistemas de reconhecimento de voz

O reconhecimento de voz é classificado em duas categorias, os sistemas

dependentes de locutor e os sistemas independentes de locutor.

No módulo de reconhecimento de voz SR-07 não há nenhuma característica

de hardware ou de software que diferencie essas duas categorias.

Dessa forma, é a própria maneira de como serão conduzidas as fases de

treinamento e reconhecimento pelos locutores que definirá o tipo de categoria em

vigência.

37

3.2.1 Sistemas dependentes

Os sistemas dependentes de locutor são capazes de reconhecer a fala de

apenas um locutor, aquele para o qual foi treinado. Caso se queira mudar de locutor,

os padrões de referência usados no treinamento também deverão ser modificados

(Dias, 2000).

Segundo o fabricante, o percentual de acertos no reconhecimento de palavras

nesse sistema gira em torno de 95%. No entanto, a desvantagem é que o sistema

mantém essa precisão apenas com a pessoa que o treinou.

3.2.2 Sistemas independentes

Os sistemas independentes de locutor, ao contrário dos sistemas

dependentes de locutor, são capazes de reconhecer a fala de qualquer pessoa,

mesmo que essa não tenha participado do treinamento, para obtenção dos padrões

de referência (Dias, 2000).

Segundo o fabricante do módulo SR-07, o percentual de acertos no

reconhecimento de palavras nesse sistema é ligeiramente menor que o sistema

dependente de locutor. Embora esse percentual não seja quantificado pelo

fabricante, foram realizados vários testes a fim de obtê-lo, e está detalhado nos itens

3.8.2 (nos testes realizados em ambientes silenciosos), e 4.5 (nos testes realizados

em ambientes com a presença do efeito de coarticulação).

A quantificação desse percentual foi avaliada e está descrita na sequência

desse capítulo.

38

3.3 Estilos de reconhecimento

Com relação à forma que os comandos serão pronunciados, os sistemas de

reconhecimento são normalmente classificados em sistemas de reconhecimento de

palavras isoladas, palavras conectadas e fala contínua.

Os sistemas de reconhecimento de palavras isoladas são os mais simples

disponíveis atualmente. Nesse sistema, o locutor pronuncia palavras isoladamente,

ou seja, com uma pausa entre as mesmas. Essa pausa é muito importante, pois

facilita a detecção de início e fim de cada comando, uma vez que a pronúncia das

palavras pode ser mais clara, além de minimizar o efeito de coarticulação (efeito que

promove alteração na forma da pronúncia das palavras devido a influência dos sons

vizinhos).

Os sistemas de reconhecimento de fala contínua possuem uma complexidade

operacional muito maior que os sistemas de reconhecimento de palavras isoladas.

Nesse sistema, o locutor pronuncia frases naturalmente, e o efeito de coarticulação

está sempre presente ao término de uma palavra e início da outra.

Os sistemas de reconhecimento de palavras conectadas são sistemas

intermediários, entre os sistemas de reconhecimento de palavras isoladas e os

sistemas de reconhecimento de fala contínua. Nesse sistema, o locutor deve

pronunciar “frases curtas”, ou seja, frases contendo duas ou três palavras apenas.

No módulo de reconhecimento de voz SR-07, a escolha do estilo de

reconhecimento está basicamente relacionada ao tempo de pronúncia da palavra

proferida pelo locutor.

39

3.4 Treinamento de palavras para serem reconhecidas

Quando o circuito é ligado, o chip HM2007 realiza uma verificação da memória

do sistema, o visualizador digital registra “00” e a luz vermelha do LED acende,

indicando que o sistema está a espera de um comando.

Para iniciar um treinamento, os seguintes passos devem ser seguidos:

primeiro, a tecla “1” deve ser pressionada (o visualizador digital mostrará “01” e a luz

do LED se apagará); segundo, a tecla “TRN” deve ser pressionada (a luz do LED se

acenderá, e será ativado o modo de treinamento para a primeira palavra); terceiro,

utilizando o microfone, a palavra que o sistema reconhecerá deve ser pronunciada.

A luz do LED deverá piscar momentaneamente, indicando que a palavra foi

aceita.

No módulo de reconhecimento de voz SR-07 não há necessidade de se

treinar a mesma palavra várias vezes, a menos que ocorram falhas na captação do

som, ou que seja gerado código de erro.

Caso ocorram falhas, o visualizador digital indicará o código do erro

correspondente, e o treinamento da primeira palavra deve ser repetido.

Para a continuação do treinamento de outras palavras, o mesmo processo

deve ser feito, pressionando a tecla “2” para a segunda palavra, a tecla “3” para a

terceira palavra, e assim por diante.

3.5 Testando o reconhecimento das palavras treinadas

A luz do LED acesa indica que o circuito está pronto pra receber um comando.

Utilizando o microfone, uma palavra (treinada ou não) deve ser pronunciada, e o seu

respectivo número de gravação deve ser mostrado no visualizador digital.

O módulo de reconhecimento de voz SR-07 prevê três tipos de erros, são

eles: o código “55”, que é gerado quando a palavra excede o tempo de 0,96

40

segundos no modo “palavras isoladas”, ou quando a palavra excede o tempo de

1,92 segundos no modo “palavras conectadas”; o código “66”, que é gerado quando

a palavra pronunciada é muito curta; e o código “77”, que é gerado quando a palavra

pronunciada não é reconhecida.

Caso várias palavras tenham sido treinadas, e algumas não estejam sendo

reconhecidas corretamente, pode-se realizar um novo treinamento apenas com a

palavra que está gerando sucessivos erros.

3.6 Apagando os dados da memória

Para apagar todas as palavras treinadas da memória, deve ser pressionado o

número “99” (o visualizador digital mostrará o número “19”, o que não representa um

erro para o circuito), seguido da tecla “CLR”.

É importante observar que todas as vezes que o módulo SR-07 for desligado,

os dados da memória serão apagados.

3.7 Testando o módulo de reconhecimento de voz SR-07

Para a realização do teste do módulo de reconhecimento de voz SR-07 foram

feitos quatro simulações em ambiente silencioso, simulando a ausência da influência

de quaisquer sons externos, utilizando dois diferentes locutores. O treinamento das

palavras a serem reconhecidas foi realizado conforme descrito no item 3.4.

Após o treinamento das palavras, as mesmas foram testadas três vezes.

Quando houve acerto, a palavra seguinte foi treinada, quando não houve acerto, o

procedimento foi repetido.

41

As palavras treinadas foram: “começo” (1), “solenóide” (2), “Fim” (3), “Pressão”

(4) e “volume” (5). Nas quatro simulações também foram testadas três palavras não

treinadas, são elas: “e”, “eletropneumática” e “sistema de reconhecimento de voz”

(pronunciada continuamente, como se fosse uma única palavra). Cada palavra,

treinada ou não, foi testada aleatoriamente dez vezes.

Com relação às palavras treinadas, foram consideradas acertadas quando o

visualizador digital apresentou corretamente o seu número correspondente no

momento do treinamento.

Quanto às palavras não treinadas, cada uma delas possui característica

específica (muito curta ou muito longa) de acordo com o módulo de reconhecimento

de voz SR-07, de modo que foi considerado acertado o “código de erro” gerado,

quando o visualizador digital apresentou corretamente o número do código de erro

em função da característica de cada palavra.

No caso da palavra “e”, foi considerado acerto quando o módulo emitiu o

código “66”, fornecido a palavras muito curtas.

A palavra “eletropneumática” foi considerada acerto quando o módulo emitiu o

código de erro “77” (nenhuma palavra encontrada).

A locução “sistema de reconhecimento de voz” (pronunciada continuamente)

foi considerada acertada quando houve geração do código de erro “55”, fornecido a

palavras muito longas.

Caso a palavra pronunciada tenha sido confundida com outra palavra

treinada, a coluna (*) foi demarcada, e foi considerado de fato, erro.

Nas tabelas 3.1, 3.2, 3.3 e 3.4, as colunas referentes à geração de códigos de

erro são: “# 55” para palavras longas; “# 66” para palavras curtas; e “# 77” para

palavras que não foram reconhecidas como treinadas.

Durante a fase de treinamento e de reconhecimento não foram verificadas a

intensidade sonora dos sons emitidos pelos locutores. É possível ainda que tenha

ocorrido algum tipo de variabilidade de fala nas simulações.

A seguir é apresentado o resultado de cada uma das simulações realizadas

pelos locutores 1 e 2, nos sistemas dependentes e independentes de locutor.

42

3.7.1 Primeira simulação

A primeira simulação foi realizada pelo locutor 1, utilizando o sistema

dependente de locutor e o sistema de reconhecimento de palavras isoladas.

Os resultados obtidos estão mostrados na tabela 3.1.

Tabela 3.1 – Resultados obtidos no reconhecimento de voz da primeira

simulação.

Palavra Acertos # 55 # 66 # 77 (*) Percentual de

acertos

“Começo” 6 0 0 0 4 60%

“Solenóide” 9 0 0 0 1 90%

“Fim” 10 0 0 0 0 100%

“Pressão” 9 0 0 0 1 90%

“Volume” 9 0 0 0 1 90%

“Eletropneumática” 10 0 0 10 0 100%

“E” 9 0 9 0 1 90%

“Sistema de

reconhecimento

de voz”

10 10

0

0 0 100%

3.7.2 Segunda simulação

A segunda simulação foi realizada pelo locutor 2, utilizando o sistema

dependente de locutor e o sistema de reconhecimento de palavras isoladas.


43

Tabela 3.2 – Resultados obtidos no reconhecimento de voz da segunda

simulação.


acertos

“Começo” 10 0 0 0 0 100%

“Solenóide” 10 0 0 0 0 100%

“Fim” 10 0 0 0 0 100%

“Pressão” 10 0 0 0 0 100%

“Volume” 9 0 0 0 1 90%


“E” 6 0 6 0 4 60%

“Sistema de

reconhecimento

de voz”

10 10

0

0 0 100%

A análise dos resultados obtidos nas tabelas 3.1 e 3.2 encontram-se no item

3.8.1.

3.7.3 Terceira simulação

A terceira simulação foi treinada pelo locutor 1 e testada pelo locutor 2,

utilizando o sistema independente de locutor e o sistema de reconhecimento de

palavras isoladas.

44


Tabela 3.3 – Resultados obtidos no reconhecimento de voz da terceira

simulação.


acertos

“Começo” 9 0 0 1 0 90%

“Solenóide” 9 0 0 1 0 90%

“Fim” 10 0 0 0 0 100%

“Pressão” 0 0 0 0 10 0%

“Volume” 10 0 0 0 0 100%


“E” 5 0 5 0 5 50%

“Sistema de

reconhecimento

de voz”

10 10

0

0 0 100%

3.7.4 Quarta simulação

A quarta simulação foi treinada pelo locutor 2 e testada pelo locutor 1,

utilizando o sistema independente de locutor e o sistema de reconhecimento de

palavras isoladas.


45

Tabela 3.4 – Resultados obtidos no reconhecimento de voz da quarta

simulação.


acertos

“Começo” 7 0 0 2 1 70%

“Solenóide” 7 0 0 3 0 70%

“Fim” 10 0 0 0 0 100%

“Pressão” 3 0 0 1 6 30%

“Volume” 9 0 0 0 1 90%


“E” 8 0 8 0 2 80%

“Sistema de

reconhecimento

de voz”

10 10

0

0 0 100%

A análise dos resultados obtidos nas tabelas 3.3 e 3.4 encontram-se no item

3.8.2.

3.8 Análise dos resultados do teste de reconhecimento de voz

A análise dos resultados obtidos será dividida em dois grupos: análise dos

resultados obtidos pelo sistema dependente de locutor (1a e 2a simulações), e

análise dos resultados obtidos pelo sistema independente de locutor (3a e 4a

simulações), em ambientes silenciosos.

46

3.8.1 Análise dos resultados obtidos pelo sistema dependente de locutor

Diante dos testes realizados em ambientes propícios (ambientes silenciosos),

verificou-se que o percentual geral de acertos para o sistema dependente de locutor

foi de 91,9%, estando, portanto, muito próximo da informação do fabricante (95%).

Um fator que chama a atenção, é que o percentual geral de acertos das

palavras treinadas foi praticamente o mesmo do percentual geral das palavras não

treinadas, ou seja, em torno de 92%, o que evidencia um desempenho muito bom do

módulo SR-07.

Evidentemente, um bom treinamento do sistema aliado a uma constância no

desempenho dos comandos para reconhecimento, tende a promover melhores

resultados, uma vez que, um dos principais motivos de baixos desempenhos está

relacionado à variabilidade dos sinais de voz. Há necessidade também de se levar

em conta as próprias condições físicas e emocionais do locutor, tanto no processo

de treinamento quanto no processo de comando para reconhecimento, a fim de

obter resultados mais eficientes.

3.8.2 Análise dos resultados obtidos pelo sistema independente de

locutor

O percentual geral de acertos para o sistema independente de locutor foi de

78,8%, sendo, portanto, menos eficiente que o sistema dependente de locutor.

Um fator que chama a atenção, é que nas duas simulações realizadas, o

percentual de acertos das palavras não treinadas foi maior que o percentual de

acertos das palavras treinadas, o que evidencia uma queda no desempenho do

módulo SR-07 em relação à dependência de locutor.

Observou-se também que uma palavra “mal” treinada dificilmente será

reconhecida, como foi o caso da palavra “pressão” na tabela 3.3. Nesse caso, é

47

importante que a palavra seja novamente treinada e testada, embora, em alguns

casos, mesmo diante de vários treinamentos, o módulo SR-07 não apresente

resultados satisfatórios.

Notou-se ainda, que eventualmente o módulo SR-07 “confunde” uma

determinada palavra treinada com outra, também treinada. O maior índice desse fato

deu-se nos sistemas independentes de locutor.

Nos sistemas independentes de locutor, além da variabilidade da voz

(características diretamente ligadas às condições físicas e emocionais do locutor), as

diferenças lingüísticas (sotaque, dialeto), também são fatores que contribuem para

uma menor eficiência nos sistemas de reconhecimento de voz.

De uma forma geral, não é possível eliminar a variabilidade da voz dos

locutores em sistemas dependentes e independentes, embora, atualmente, muitos

estudos apontem para a normalização (modelação) dessas variações, que devem

ser realizadas diretamente pelas tecnologias de reconhecimento de voz adotado,

visando exatamente melhorias significativas.

Em condições propícias, o módulo SR-07 apresentou um desempenho

satisfatório. No entanto, na prática do dia a dia, essa talvez não seja a condição a

que o módulo será submetido, dessa forma, tornou-se importante a realização de

outros testes simulando ambientes com características diferentes e submetidos a

ruídos externos.

Estes testes foram realizados e estão apresentados no próximo capítulo.

48

CAPÍTULO 4: ANÁLISE DE DESEMPENHO DO MÓDULO DE RECONHECIMENTO DE VOZ SR-07 COM IMPLEMENTAÇÃO DO EFEITO DE

COARTICULAÇÃO

Toda ação do circuito eletropneumático implementada nesse trabalho foi

executada via comando de voz reconhecida pelo módulo SR-07. Embora o

fabricante informe, através do catálogo do produto, que o índice de desempenho do

módulo seja da ordem de 95%, não há maiores esclarecimentos nem informações

detalhadas acerca desse percentual, especialmente em relação à influência do ruído

de fundo nesse desempenho.

Conforme foi descrito no capítulo anterior, o módulo de reconhecimento de

voz SR-07 apresentou bons resultados em ambientes considerados propícios, no

entanto, devido ao seu papel extremamente importante no processo de

automatização, tornou-se necessário a realização de novos testes e simulações, a

fim de se obter resultados mais precisos acerca do seu desempenho, especialmente

em possíveis ambientes a que será submetido.

Embora sejam muitos os fatores, especialmente os relacionados às

variabilidades da fala, que influenciam em sistemas de reconhecimento de voz, foi

tratado aqui a influência da variação do nível sonoro externo no desempenho desse

módulo, ou seja, foi induzido o efeito de coarticulação. Segundo Dias (2000),

coarticulação é o efeito que provoca alteração na forma de pronúncia dos sons

devido à influência dos sons vizinhos.

Além de analisar o desempenho do reconhecimento de voz em palavras

treinadas, foi analisado também o desempenho do sistema em palavras não

treinadas, uma vez que, caso a palavra não treinada seja “confundida” com outra

treinada, possa ocasionar efeitos indesejáveis.

Foram realizados testes em dois ambientes com características diferentes,

embora, com nível sonoro médio equivalente. Num dos ambientes foram simulados

oscilações de máximos e mínimos na amplitude das ondas sonoras emitidas. No

outro ambiente, as oscilações da amplitude das ondas sonoras foram minimizadas.

Na obtenção das bases de dados foram realizados treinamentos e testes com

quatro locutores diferentes, possibilitando a análise do desempenho do módulo SR-

49

07 em sistemas dependentes e independentes de locutor, utilizando-se palavras

isoladas.

4.1 Metodologia utilizada

Para obtenção dos resultados, as palavras treinadas e testadas foram

gravadas, com o intuito de minimizar alguns efeitos de variabilidades de fala,

principalmente os associados às condições físicas e emocionais do locutor.

Para a captação dos sons foi utilizado um microfone Clone tipo condensador,

com polarização Omni-direcional e sensibilidade de 58 dB (+/- 3 dB) na faixa de

freqüência entre 20 Hz e 20 kHz. Para a gravação das palavras foi utilizado um

notebook HP, com processador Intel Pentium Duol-Core, sob a plataforma Windows

Vista.

Foram realizados treinamentos com quatro locutores diferentes, obtendo

quatro resultados diferentes para os sistemas dependentes de locutor. Nesse

sistema, o teste de reconhecimento foi realizado pelo próprio locutor que realizou o

treinamento.

Nos sistemas independentes de locutor, utilizou-se um locutor para a

realização do treinamento, e locutores alternados nos testes de reconhecimento.

Seis palavras (referentes a cores) foram testadas, são elas: (1) amarelo, (2)

vermelho, (3) preto, (4) marrom, (5) roxo e (6) bege. As palavras “1”, “2” e “3” foram

treinadas para serem reconhecidas, e as palavras “4”, “5” e “6”, não foram treinadas.

Para as palavras treinadas, foi considerado “acerto” quando o sistema as

reconheceu, e “não acerto” quando o sistema gerou código de erro, ou quando certa

palavra treinada foi “confundida” com outra, também treinada.

Para as palavras não treinadas, o “acerto” foi considerado quando o sistema

gerou um código de erro específico (referente a palavra não treinada) ao serem

pronunciadas. Em contrapartida, foi considerado “não acerto” para os demais

50

códigos de erro (palavras muito curtas ou muito cumpridas), ou quando o sistema a

“confundiu” com outra palavra treinada.

Para a implementação do efeito de coarticulação, os testes foram realizados

num ambiente fechado com variações específicas do nível sonoro, medido por um

decibelímetro Minipa MSL – 1352A, com range de operação entre 30 dB e 130 dB.

Dois tipos de ruídos foram implementados, ambos com variação de nível

sonoro entre 50 dB e 70 dB (sendo que acima de 70 dB o módulo SR-07 torna-se

inoperante). O primeiro tipo de ruído foi definido por conversações normais entre

pessoas e músicas, e o segundo tipo, definido por sons contínuos de máquinas e

“chiado” de rádio.

Em todos os testes de reconhecimento, a intensidade sonora captada pelo

microfone do módulo de reconhecimento de voz SR-07, foi entre 1 x 10-5 W/m2 e 1 x

10-4 W/m2. Ao todo foram realizados 2.160 testes. Os resultados foram tabelados

(tabelas 4.1, 4.2, 4.3, 4.4, 4.5, 4.6, 4.7 e 4.8), e avaliados (nos itens 4.3, 4.5 e 4.6).

4.2 Análise comparativa de sistemas dependentes de locutor com

ocorrência de coarticulação

Embora sejam muitos os fatores que influenciam num sistema de

reconhecimento de voz, será apresentado nessa seção o grau de interferência dos

sons (ruídos) externos na performance do módulo de reconhecimento de voz SR-07,

em sistemas dependentes de locutor. Os ruídos foram divididos em dois tipos:

conversação normal entre pessoas ou músicas (tipo A) e “chiados” de máquinas ou

rádio (tipo B).

Em conversações de pessoas ou músicas é pouco provável a manutenção

exata do nível sonoro ambiente, uma vez que ocorrem picos na amplitude das ondas

sonoras emitidas. Em “chiados” de máquinas ou de rádio, por exemplo, com

emissão de sons contínuos, há uma tendência maior de manter a estabilidade do

nível sonoro ambiente.

51

As bases de dados de treinamentos e testes com ocorrência de coarticulação

e, respectivos percentuais de acertos no reconhecimento das palavras, estão

descritas nas tabelas 4.1, 4.2, 4.3 e 4.4.

Tabela 4.1 – Descrição da base de dados treinada e testada pelo locutor 1,

com ocorrência de coarticulação tipo A.

Palavra % Acertos

50 dB +/- 3 dB

% Acertos

55 dB +/- 3 dB

% Acertos

60 dB +/- 3 dB

% Acertos

65 dB +/- 3 dB

Amarelo 70 50 40 0

Vermelho 90 90 60 30

Preto 100 100 100 90

Desempenho 86,7 80,0 66,7 40,0

Marron 100 100 100 100

Roxo 100 100 100 100

Bege 100 100 100 100

Desempenho 100,0 100,0 100,0 100,0


com ocorrência de coarticulação tipo A.

Palavra % Acertos

50 dB +/- 3 dB

% Acertos

55 dB +/- 3 dB

% Acertos

60 dB +/- 3 dB

% Acertos

65 dB +/- 3 dB

Amarelo 100 90 60 30

Vermelho 100 100 100 80

Preto 100 100 90 70

Desempenho 100,0 96,7 83,3 60,0

Marron 100 100 100 90

Roxo 100 100 100 100

Bege 100 100 100 90

Desempenho 100,0 100,0 100,0 93,3

52


com ocorrência de coarticulação tipo B.

Palavra

% Acertos

50 dB

(+/- 3 dB)

% Acertos

55 dB

(+/- 3 dB)

% Acertos

60 dB

(+/- 3 dB)

% Acertos

65 dB

(+/- 3 dB)

% Acertos

68 dB

(+/- 3 dB)

Amarelo 100 100 100 100 60

Vermelho 100 100 100 100 80

Preto 100 100 90 100 90

Desempenho 100,0 100,0 96,7 100,0 76,7

Marron 80 80 90 90 100

Roxo 100 100 100 100 100

Bege 100 100 100 100 100

Desempenho 93,3 93,3 96,7 96,7 100,0


com ocorrência de coarticulação tipo B.

Palavra

% Acertos

50 dB

(+/- 3 dB)

% Acertos

55 dB

(+/- 3 dB)

% Acertos

60 dB

(+/- 3 dB)

% Acertos

65 dB

(+/- 3 dB)

% Acertos

68 dB

(+/- 3 dB)

Amarelo 100 100 100 100 90

Vermelho 100 100 100 90 90

Preto 100 100 100 100 80

Desempenho 100,0 100,0 100,0 96,7 86,7

Marron 100 100 100 100 100

Roxo 100 100 100 100 100

Bege 70 70 80 60 40

Desempenho 90,0 90,0 93,3 86,7 80,0

53

4.3 Resultados do sistema dependente de locutor

Os resultados foram apresentados em função do tipo de ruído implementado

na realização dos testes.

Em primeiro lugar, a partir dos resultados obtidos na ocorrência de

coarticulação tipo A, observou-se que, a medida que o nível sonoro ambiente foi

aumentando, o desempenho do sistema para palavras treinadas foi diminuindo. Em

conversações ou músicas, os picos máximos de amplitude de ondas sonoras

provocaram especialmente geração de código de erro pertinente à palavra que não

constava como “treinada”, ou código de erro pertinente à palavra “muito curta”.

Em ambientes com variação de nível sonoro entre 50 dB e 60 dB (+/- 3 dB), o

desempenho do sistema esteve na ordem de 85,6%, e em ambientes com nível

sonoro de 65 dB (+/- 3 dB), o desempenho caiu rapidamente para a ordem de 50%.

Para palavras não treinadas, o desempenho do sistema foi da ordem de 99,2

%, com variação de nível sonoro entre 50 dB e 65 dB (+/- 3 dB). Esse índice,

embora alto, pode ser considerado “duvidoso”, baseando-se no baixo índice obtido

em palavras treinadas.

Acima de 65 dB, o módulo de reconhecimento de voz SR-07 começou a gerar

sucessivos códigos de erro, não sendo possível a realização de testes.

Em segundo lugar, a partir dos resultados obtidos na ocorrência de

coarticulação tipo B, observou-se que, mesmo com a elevação do nível sonoro, de

50 dB a 65 dB (+/- 3 dB), o desempenho do sistema se manteve estável, com

percentual de acerto da ordem de 99,2% para palavras treinadas. Com o nível

sonoro ambiente de 68 dB (+/- 3 dB), esse percentual caiu para 81,7%.

Não foi observado variação significativa no percentual de acertos para

palavras não treinadas, mesmo com variação do nível sonoro entre 50 dB e 68 db

(+/- 3 dB). Esse índice esteve na ordem de 92%.

Acima de 68 dB, o módulo de reconhecimento de voz SR-07 começou a gerar

sucessivos códigos de erro, predominantemente referente ao de “palavras longas”,

não sendo possível a realização de testes. Esse resultado foi bastante interessante,

pois encontrou-se perfeitamente coerente com a própria característica do ambiente

54

tipo B, ou seja, com poucas oscilações de máximos e mínimos referentes às

amplitudes das ondas sonoras provenientes do ruído. Essa constância na

intensidade sonora do ruído, certamente fez com que o sistema o “confundisse”

como sendo uma continuidade da palavra pronunciada.

O gráfico 4.1 apresenta uma síntese do desempenho do módulo SR-07 a

partir dos testes realizados em sistemas dependentes de locutor.

Gráfico 4.1 – Gráfico de desempenho em sistemas dependentes de locutor

Nesse gráfico, adotou-se para a série 1, os resultados obtidos para as

palavras não treinadas em ambientes tipo B; a série 2, os resultados obtidos para as

palavras treinadas em ambientes tipo B; a série 3, os resultados obtidos para as

palavras não treinadas em ambientes tipo A; e a série 4, os resultados obtidos para

as palavras treinadas em ambientes tipo A.

O melhores resultados dessa categoria (dependência de locutor) ocorreu em

ambientes com variação de nível sonoro entre 50 dB e 65 dB (+/- 3 dB), sem

excessivas oscilações nas amplitudes das ondas sonoras (tipo B), minimizando

dessa forma o efeito de coarticulação. Nesse caso, o percentual de acertos foi da

ordem de 95,9%, confirmando a expectativa do fabricante, que foi de 95%. Com 68

55

dB (+/- 3 dB), houve uma pequena queda de 10% no desempenho. Acima de 68 dB,

o sistema torna-se instável e inoperante.

4.4 Análise comparativa de sistemas independentes de locutor com

ocorrência de coarticulação

É apresentado nesse tópico o grau de interferência dos sons (ruídos) externos

no desempenho do módulo de reconhecimento de voz SR-07, em sistemas

independentes de locutor nos ambientes tipo A e tipo B.

Na implementação do sistema independente de locutor, o treinamento foi

realizado por um dos locutores, e os testes foram realizados pelos locutores

restantes, de forma aleatória.

As bases de dados de treinamentos e testes com ocorrência de coarticulação

e, respectivos percentuais de acertos no reconhecimento das palavras, estão

descritas nas tabelas 4.5, 4.6, 4.7 e 4.8.

Tabela 4.5 – Descrição da base de dados treinada pelo locutor 1, e testada

aleatoriamente pelos locutores 2, 3 e 4, com ocorrência de coarticulação tipo A.

Palavra % Acertos

50 dB +/- 3 dB

% Acertos

55 dB +/- 3 dB

% Acertos

60 dB +/- 3 dB

% Acertos

65 dB +/- 3 dB

Amarelo 0 0 0 0

Vermelho 0 0 0 0

Preto 90 100 60 10

Desempenho 30,0 33,3 20,0 3,3

Marron 100 100 100 100

Roxo 100 100 100 100

Bege 100 100 100 100

Desempenho 100,0 100,0 100,0 100,0

56


aleatoriamente pelos locutores 1, 3 e 4, com ocorrência de coarticulação tipo A.

Palavra % Acertos

50 dB +/- 3 dB

% Acertos

55 dB +/- 3 dB

% Acertos

60 dB +/- 3 dB

% Acertos

65 dB +/- 3 dB

Amarelo 30 20 30 30

Vermelho 0 0 0 0

Preto 70 60 60 50

Desempenho 33,3 26,7 30,0 26,7

Marron 100 100 100 100

Roxo 100 100 100 90

Bege 100 100 100 100

Desempenho 100,0 100,0 100,0 96,7


aleatoriamente pelos locutores 1, 2 e 4, com ocorrência de coarticulação tipo B.

Palavra

% Acertos

50 dB

(+/- 3 dB)

% Acertos

55 dB

(+/- 3 dB)

% Acertos

60 dB

(+/- 3 dB)

% Acertos

65 dB

(+/- 3 dB)

% Acertos

68 dB

(+/- 3 dB)

Amarelo 0 0 0 0 0

Vermelho 0 0 0 0 0

Preto 20 40 20 20 10

Desempenho 6,7 13,3 6,7 6,7 3,3

Marron 100 100 90 100 90

Roxo 100 100 90 100 100

Bege 100 100 100 90 100

Desempenho 100,0 100,0 93,3 96,7 96,7

57


aleatoriamente pelos locutores 1, 2 e 3, com ocorrência de coarticulação tipo B.

Palavra

% Acertos

50 dB

(+/- 3 dB)

% Acertos

55 dB

(+/- 3 dB)

% Acertos

60 dB

(+/- 3 dB)

% Acertos

65 dB

(+/- 3 dB)

% Acertos

68 dB

(+/- 3 dB)

Amarelo 40 50 20 30 0

Vermelho 0 0 0 0 0

Preto 80 80 90 80 30

Desempenho 40,0 43,3 36,7 36,7 10,0

Marron 100 100 100 100 100

Roxo 100 100 100 100 100

Bege 20 30 10 30 90

Desempenho 73,3 76,7 70,0 76,7 96,7

4.5 Resultados do sistema independente de locutor

Diferentemente dos resultados apresentados nos sistemas dependentes de

locutor, não foram observadas diferenças significativas nos testes realizados em

ambientes com ruídos tipo A ou tipo B, nas situações em que os testes de

reconhecimento foram realizados por locutores diferentes daqueles que fizeram o

treinamento.

Uma pequena diferença percebida foi o limite do nível sonoro aceitável pelo

módulo de reconhecimento de voz SR-07. Para as simulações realizadas em

ambientes com ruído tipo A, o nível sonoro máximo sem geração consecutivas de

códigos de erros foi de 65 dB (+/- 3 dB), enquanto nas simulações realizadas em

ambientes com ruído tipo B, consegue-se chegar aos 68 dB (+/- 3 dB), sem geração

consecutiva de códigos de erros, muito embora, o percentual de acertos tenha sido

extremamente baixo em todos os casos.

58

De acordo com os resultados obtidos para as palavras treinadas, verificou-se

que, de fato, as maiores influências no desempenho do módulo SR-07, encontram-

se nas próprias características pertinentes aos sistemas independentes de locutor.

Dessa forma, o desempenho do sistema nos ambientes tipo A ou tipo B, com

variação do nível sonoro entre 50 dB e 65 dB (+/- 3 dB) para palavras treinadas, foi

da ordem de 22,6%.

Para as palavras não treinadas, o percentual considerado de acertos foi da

ordem de 93,2%, também, sem diferenciação do tipo de ambiente e variações dos

níveis sonoros. Esse índice, embora elevado, pode provocar certa discussão e ser

considerado “duvidoso”, se comparado com o desempenho obtido nas simulações

de palavras treinadas (22,6%), bem como, o próprio código de erro gerado com

freqüência em ambos os casos (código de erro referente a ausência de

treinamento).

Destacou-se também a inoperância do sistema em níveis sonoros acima de

65 dB (+/- 3 dB) nos ambientes tipo A, e 68 dB (+/- 3 dB) nos ambientes tipo B.

Acima do limite de nível sonoro no primeiro caso, os erros que ocorreram com

freqüência foi pertinente a palavras não treinadas. Em contrapartida, acima do limite

de nível sonoro no segundo, os erros que ocorreram com freqüência foi pertinente a

palavras muito longas (o módulo SR-07 reconhece palavras isoladas pronunciadas

dentro de um intervalo de tempo de até 1,92 s).

De fato, os piores desempenhos ocorreram nos sistemas independentes de

locutor. Não houve variação significativa em termos de desempenho nas simulações

realizadas nos ambientes tipo A e tipo B, sendo que o percentual médio de acertos

para palavras treinadas, com variação de nível sonoro entre 50 db e 65 db (+/- 3 dB),

foi de 24,5%. Nesse caso, o próprio índice elevado de acertos para palavras não

treinadas (média de 92,7%), entre 50 dB e 65 dB (+/- 3 dB), torna-se duvidoso, em

virtude do baixo índice de acerto das palavras treinadas.

Dessa forma, a eficácia do módulo de reconhecimento de voz SR-07 em

sistemas cujo locutor que pronunciará os comandos (palavras) para reconhecimento

não foi o mesmo que realizou o treinamento, é extremamente baixa. Além disso, a

ocorrência de coarticulação afeta diretamente o desempenho do módulo de

reconhecimento de voz SR-07.

59

Essa interferência pode ser minimizada se o ruído externo não for muito

instável (apresentando poucas variações nas amplitudes das ondas sonoras),

mesmo com variação significativa de nível sonoro (até 65 dB, +/- 3 dB).

O gráfico 4.2 apresenta uma síntese do desempenho do módulo SR-07 a

partir dos testes realizados em sistemas independentes de locutor.

Gráfico 4.2 – Gráfico de desempenho em sistemas independentes de locutor

Nesse gráfico, adotou-se para a série 1, os resultados obtidos para as

palavras não treinadas em ambientes tipo B; a série 2, os resultados obtidos para as

palavras treinadas em ambientes tipo B; a série 3, os resultados obtidos para as

palavras não treinadas em ambientes tipo A; e a série 4, os resultados obtidos para

as palavras treinadas em ambientes tipo A.

60

4.6 Comparativo entre os sistemas dependentes e independentes de

locutor

O gráfico 4.3 apresenta os resultados dos testes realizados nos sistemas

dependentes e independentes de locutor, realizados em ambientes diferentes. O

percentual de acertos apontado pelo gráfico refere-se apenas às palavras treinadas.

As siglas “SDL–A”, “SDL–B”, “SIL–A” e “SIL–B”, referem-se, respectivamente,

aos resultados obtidos na categoria de dependência de locutor, no ambiente tipo A,

aos resultados obtidos na categoria de dependência de locutor, no ambiente tipo B,

aos resultados obtidos na categoria de independência de locutor, no ambiente tipo

A, e aos resultados obtidos na categoria de independência de locutor, no ambiente

tipo B.

Nesse gráfico fica bem evidenciado que o melhor desempenho do módulo SR-

07 para palavras treinadas ocorreu nos sistemas dependentes de locutor em

ambiente “tipo B”, cujo nível sonoro esteve entre 50 e 65 dB.

Gráfico 4.3 – Gráfico comparativo entre os sistemas dependentes e


61

CAPÍTULO 5: O CIRCUITO ELÉTRICO

A concepção do hardware deu-se a partir da analise do circuito disponível no

módulo de reconhecimento de voz SR-07, do tipo de comunicação escolhido e dos

requisitos para saída.

Além disso, no caso específico desse projeto, o circuito elétrico de controle do

circuito eletropneumático foi dividido em dois: um “circuito transmissor”, posicionado

à distância (de onde serão realizados os comandos), e outro, “circuito receptor”,

posicionado junto às válvulas de comando que energiza as bobinas das válvulas

solenóides.

5.1 O método de transmissão

Para a escolha do método de transmissão de dados levou-se em conta

principalmente a compatibilidade das características técnicas de transmissão com as

características técnicas do módulo de reconhecimento de voz SR-07, bem como, o

custo dos componentes elétricos.

Dessa forma, escolheu-se que a transmissão dos dados fosse feita por rádio

freqüência (RF), utilizando-se os módulos TXC1 (Hybrid Transmitter) e RXD1 (Hybrid

Receiver), mostrados na figura 5.1.

A transmissão e recepção de dados sem fio (wireless) dos módulos TXC1 e

RXD1 pode ocorrer com um alcance de até 100 metros (sem obstáculos), desde que

a antena e a fonte de alimentação do transmissor sigam as recomendações técnicas

do fabricante.

As faixas de freqüência de operação dos módulos TXC1 e RXD1 são de 315

MHz, 418MHz e 434 MHz. Essas faixas de freqüências são pré-reguladas pelo

fabricante, dispensando qualquer tipo de regulagem por parte do desenvolvedor.

62

No desenvolvimento desse projeto foi utilizada a faixa de freqüência de 434

MHz para o par TXC1 e RXD1.

A largura de banda (para a transferência dos dados) do módulo TXC1 é de 4

kHz, já a do módulo RXD1, é de 2 kHz. Portanto, para que o módulo receptor RXD1

consiga receber os dados corretamente, o transmissor TXC1 deverá limitar-se a

transmitir os dados numa taxa inferior ou igual a 2 kHz.

Tanto o transmissor TXC1, quanto o receptor RXD1, adotam a modulação

ASK.

Figura 5.1 – Os módulos TXC1 e RXD1

5.2 O transmissor

Ao analisar o módulo, verificou-se que a única saída disponível seria o

conector que leva aos displays, ou seja, os 4-bits que saem do CI 7448, sendo

assim, o local ideal para interceptar a informação de saída do módulo.

63

Achado o ponto, escolheu-se os 4 pinos que controlam o display das unidades

para ser trabalhado, uma vez que só foram utilizados 8 saídas nesse projeto.

A necessidade de um amplificador de sinal deu-se porque a saída de sinal do

módulo SR-07 não conseguia suprir o display e o transmissor ao mesmo tempo.

A figura 5.2 mostra o esquema do circuito de reconhecimento de voz SR-07.

Figura 5.2 – Circuito do módulo SR-07 (saída dos displays)

A figura 5.3 mostra a concepção de ligação elétrica para o circuito

transmissor.

Nessa concepção, o circuito principal do módulo SR-07, o visualizador digital

(display) e o transmissor são alimentados com a tensão de 5 V.

Inicialmente, os dados eram enviados a dois circuitos integrados (um circuito

integrado pra cada display), conforme descrito no capítulo 3. Uma vez que para o

desenvolvimento desse trabalho foram utilizados apenas 4 comandos de voz, optou-

se para a interceptação dos dados enviados apenas para o display das unidades

(com 8 saídas, proporcionando capacidade máxima para 8 comandos diferentes).

Tal fato permitirá apresentar uma metodologia para simular um ambiente de

64

independência de locutor, de forma a manter um alto desempenho no módulo SR-

07. Essa metodologia está descrita no item 5.7.

Após a interceptação e amplificação do sinal, os dados são enviados ao

transmissor TXC1.

Figura 5.3 – Concepção de ligação elétrica para o circuito transmissor.

5.3 O circuito transmissor

O circuito transmissor foi dividido basicamente em três circuitos menores, que

são: o circuito de alimentação, o circuito amplificador de sinal e o circuito encoder

paralelo/serial.

65

5.3.1 O circuito de alimentação do transmissor

O circuito de alimentação é alimentado pelo conector J1, sendo que este está

conectado à alimentação 5 V do módulo SR-07. Conta ainda com um LED D1, que

indica quando o circuito está ligado.

A figura 5.4 mostra o circuito de elétrico de alimentação do transmissor.

Figura 5.4 – O circuito elétrico de alimentação do transmissor

5.3.2 O circuito amplificador de sinal

O circuito recebe sinal das unidades do módulo SR-07 através do conector J2

e amplifica em corrente, pelos transistores BC549 ,Q1 a Q4, enviando os dados para

o display e o módulo transmissor, sendo que as saídas A_AMP, B_AMP, C_AMP e

D_AMP são os 4-bits de sinal do display já amplificados.

66

A figura 5.5 mostra o circuito amplificador de sinal.

Figura 5.5 – O circuito amplificador de sinal

5.3.3 O circuito encoder paralelo/serial

No circuito mostrado na figura 5.6, A,B,C e D_AMP são os 4-bits de sinal que

chegam ao encoder. O conector J4 é a saída para o display.

O encoder U1 recebe dados amplificados (A,B,C,D_AMP) nos PORTs D6 a

D9. O sinal recebido em paralelo é convertido para serial e mandado para o modulo

transmissor RF TXC1 no conector J2 através do PORT DOUT.

Os resistores R1, R2 e RV1 e o capacitor C1 fazem parte do circuito de

oscilação do encoder, sendo que RV1 é um potenciômetro para ajuste.

67

Os PORTs A1 a A5 servem como endereçamento de dados, sendo que neste

caso podem ser todos aterrados.

O conector J3 é a antena do modulo TXC1.

Figura 5.6 – O circuito encoder paralelo/serial.

5.4 O receptor

Para o acionamento individual dos dispositivos externos da placa foi feito uma

seleção digital com portas lógicas a partir dos dados recebidos do módulo receptor

RXD1.

A tabela verdade (5.1) foi gerada a partir dos requisitos de entrada e

apresentada abaixo.

68

Tabela 5.1 – Tabela verdade.

Por fim, a concepção de ligação elétrica para o circuito receptor foi feita como

mostra a figura 5.7.

Figura 5.7 – Concepção de ligação elétrica para o circuito receptor.

69

Nessa concepção, a entrada e a saída do circuito apresentam uma tensão de

24 V. Dessa forma, o circuito receptor pode comunicar-se sem restrições com o

circuito elétrico de controle do circuito eletropneumático, bem como, com as bobinas

das válvulas solenóides que comandam os elementos de trabalho.

O regulador de tensão reduz para 5 V a alimentação do módulo RXD1 e do

circuito da seleção digital.

Os dados recebidos pelo receptor após serem processados são enviados para

as respectivas saídas, de 1 a 8. Esses são os pontos de ligação com as válvulas

solenóides ou com os relés do circuito eletropneumático.

5.5 O circuito receptor

O circuito receptor foi dividido basicamente em três circuitos menores, que

são: o circuito de alimentação, o circuito decoder paralelo/serial e o circuito de

seleção digital.

5.5.1 O circuito de alimentação do receptor

O sistema de alimentação conta com uma entrada de tensão 24V, J1, um

regulador de tensão em U2 para suprir os 5V do circuito digital, e uma distribuição

dos pontos de 24V, J12 a J19 para os dispositivos (onde serão ligados às válvulas

solenóides). O circuito ainda conta com um LED, D6, que indica quando o circuito

está ligado.

A figura 5.8 mostra o circuito elétrico de alimentação do receptor.

70

Figura 5.8 – O circuito elétrico de alimentação do receptor.

5.5.2 O circuito decoder paralelo/serial

O decoder U1, mostrado na figura 5.9, recebe dados de forma serial do

módulo receptor RXD1 (no conector J2), e os transforma novamente em paralelo.

71

Neste ponto os dados são enviados para leds indicadores, D1 (Link Estabelecido),

D2 a D5 (Dados) e para o circuito digital responsável pela seleção das portas de

acionamento.

Figura 5.9 – O circuito decoder paralelo/serial.

O conector J3 é a antena do modulo RXD1, e os pontos A,B,C e D são os 4

bits de sinal que saem do decoder.

U3 é um CI inversor dos bits recebidos, sendo que seus respectivos sinais

invertidos são A/,B/,C/ e D/.

72

5.5.3 O circuito de seleção digital

O circuito é formado por quatro CIs AND, U4 a U7 de quatro entradas que

receberam os bits A,B,C e D e A/,B/,C/ e D/ de forma a acionarem cada saída, de 1+

a 8+, J4 a J11, individualmente.

O circuito conta com um transistor BD131, Q1 a Q8, que funciona como chave

para o dispositivo ligado em seus terminais.

Após a seleção digital dos dados de entrada, um dos conectores, J4 a J11,

estará energizado com tensão de 24 V, a fim de comunicar-se com o circuito elétrico

de controle do circuito eletropneumático.

O circuito de seleção digital é mostrado na figura 5.10.

Figura 5.10 – O circuito de seleção digital.

73

5.6 Os circuitos “Transmissor” e “Receptor”

A figura 5.11 mostra como ficaram os circuitos após seu desenvolvimento.

Na figura 5.11(a), o circuito transmissor (composto pelos circuitos de

alimentação, circuito amplificador de sinal e o circuito encoder paralelo/serial) está

acoplado ao módulo de reconhecimento de voz SR-07, ambos alimentados com 5V

de tensão. Esse conjunto é mantido à distância, situado próximo ao locutor que irá

pronunciar os comandos.

Na figura 5.11(b), o circuito receptor (composto pelos circuitos de alimentação,

circuito decoder paralelo/serial e o circuito de seleção digital) está montado junto aos

conectores de 24V e 0V, que serão ligados às bobinas das válvulas solenóides.

Esse conjunto é mantido próximo ao sistema eletropneumático.

(a) (b)

Figura 5.11 – (a) circuito transmissor; (b) circuito receptor

Conectores (0V)

Conectores (24V)

74

5.7 Simulando um ambiente de independência de locutor

Conforme descrito no capítulo 4, o módulo de reconhecimento de voz SR-07

apresentou um desempenho muito baixo, da ordem de 24,5%, em sistemas

independentes de locutor para palavras treinadas. Já em sistemas dependentes de

locutor, o desempenho do módulo foi bastante satisfatório, principalmente em

ambientes cujo ruído externo apresentou poucas oscilações nas amplitudes das

ondas sonoras, com índice de acertos da ordem de 95,9%.

Diante desses percentuais, tornou-se inviável a utilização do módulo na

categoria de independência de locutor. No entanto, será apresentada nesse item

uma metodologia que consiste em simular um sistema independente de locutor, de

forma que o desempenho do módulo SR-07 seja o de sistema dependente de

locutor.

A fim de exemplificar, podemos considerar dois comandos de voz: o comando

“Início” (que pode significar o início de alguma ação), e o comando “Fim” (que pode

significar o fim dessa ação). Consideremos ainda cinco locutores diferentes, sendo

que todos os locutores farão o treinamento dos comandos “Início” e “Fim” no módulo

de reconhecimento de voz SR-07.

A metodologia consiste nos seguintes detalhes: no treinamento da palavra

“Início” pelo primeiro locutor, o comando será associado ao número “01” do módulo

SR-07, enquanto o comando “Fim”, associado ao número “02”; quanto ao segundo

locutor, o comando “Início” será associado ao número “11”, e o comando “Fim”, ao

número “12”; o terceiro locutor associará aos comandos “Início” e “Fim”, os números

“21” e “22”, respectivamente; o quarto locutor associará aos comandos “Início” e

“Fim”, os números “31” e “32”, respectivamente; finalmente, o quinto locutor

associará aos comandos “Início” e “Fim”, os números “41” e “42”, respectivamente.

Na fase de reconhecimento, qualquer comando realizado por qualquer locutor

caracterizará o sistema de dependência de locutor. No entanto, a metodologia

apresentada se beneficia de uma característica de construção e interceptação do

comando (sinal) pelo circuito elétrico transmissor. O registrador 74LS373 do módulo

SR-07 (figura 3.3) envia o sinal a dois circuitos integrados CI 7448 (sendo um CI

75

para o visualizador das unidades, e outro, para o visualizador das dezenas). A

interceptação do sinal pelo circuito elétrico transmissor nesse trabalho foi feita

apenas no CI 7448 do visualizador das unidades.

Dessa forma, o sinal enviado pelo transmissor referente aos comandos “01”,

“11”, “21”, “31” e “41”, será simplesmente, “1”. Similarmente, o sinal enviado pelo

transmissor referente aos comandos “02”, “12”, “22”, “32” e “42”, será simplesmente,

“2”.

Tecnicamente, a metodologia apresentada caracteriza um sistema de

dependência de locutor, mas que, devido às características de construção dos

circuitos elétricos, é possível simular um sistema de independência de locutor

(restrita nesse exemplo, aos cinco locutores), mantendo alto desempenho do módulo

de reconhecimento de voz SR-07.

76

CAPÍTULO 6: DESENVOLVIMENTO DO CIRCUITO ELETROPNEUMÁTICO

Para a realização dos testes e simulações presentes nesse trabalho, foi

tomado como referência um circuito eletropneumático capaz de atender os requisitos

de automatização de um dispositivo denominado, Silo Alimentador Automático (de

grãos), com o intuito de obter uma sequência de movimentos com aplicação prática.

Nos tópicos seguintes, serão apresentadas as etapas de desenvolvimento

desse circuito.

6.1 Silo Alimentador Automático (de grãos)

O sistema de alimentação (de grãos – adotado nesse trabalho) é um sistema

automático integrado, alimentado por energia pneumática e elétrica.

Princípio de funcionamento: Os recipientes a serem preenchidos com grãos

movem-se sobre a esteira 2 (na direção transversal a representação do esquema).

Uma vez que o sensor de presença capta o correto posicionamento do recipiente,

dá-se o início da sequência dos movimentos. A haste do cilindro B avança, limitando

o medidor de volumes e impedindo a saída dos grãos da bandeja. Logo após, a

haste do cilindro A deve ser recuada para que os grãos ocupem o compartimento

medidor de volume, e avançada em seguida. A haste do cilindro B recua, permitindo

agora que os grãos com um volume pré determinado possa cair até o recipiente. A

seguir, a haste do cilindro C avança, posicionando o recipiente, agora cheio de

grãos, na esteira 3. Logo após, a haste do cilindro C deve recuar, se reposicionando.

O sensor de nível é responsável por “perceber” a necessidade ou não de realimentar

a bandeja.

Para as simulações desse trabalho foi considerada apenas a automatização

dos movimentos dos atuadores lineares pneumáticos.

A figura 6.1 apresenta o esquema de funcionamento do projeto proposto.

77

Figura 6.1 – Esquema de funcionamento do Silo Alimentador Automático

6.2 Diagramas do método seqüencial

O desenvolvimento do circuito eletropneumático do silo alimentador

automático foi realizado utilizando-se o método seqüencial. Para a obtenção das

equações de acionamento dos elementos de trabalho foi feito os diagramas de

movimentos e de acionamentos, conforme apresenta a figura 6.2.

O diagrama trajeto x passo e o diagrama de comando dos atuadores mostram

a sequência dos movimentos dos elementos de trabalho (cilindros pneumáticos) que

atendem ao processo de automatização do silo alimentador automático.

O diagrama de posicionamento dos atuadores mostra a posição dos mesmos

nos diferentes passos do ciclo completo do processo automatizado. A posição

78

Diagrama

Trajeto x Passo

Posicionamento dos

atuadores

Diagrama de atuação

dos sensores

Diagrama de comando

dos atuadores

recuada do cilindro pneumático é representada pelo índice “0”, enquanto, a posição

avançada, representada pelo índice “1”.

Os sensores elétricos ao serem acionados, emitem um sinal informando ao

circuito de controle a posição atual de cada elemento de trabalho. O diagrama de

acionamento dos sensores mostrado na figura 6.2, registra o momento que cada

sensor é acionado, bem como, os passos em que ele se mantém acionado.

Figura 6.2 – Diagramas do método sequencial

79

6.3 Equações de acionamento dos elementos de trabalho

Observando o diagrama de posicionamento dos atuadores (cilindros) na figura

6.2, verifica-se que os passos 1 e 5 possuem a mesma combinação (1,0,0), no

entanto, os acionamentos gerados a partir de cada passo são diferentes. Enquanto

no passo 2 o cilindro “A” deve recuar, no passo 6, é o cilindro “C” quem deve recuar.

O mesmo ocorre com relação aos passos 2 e 4, com combinações iguais

(1,1,0), e nos passos subseqüentes, os acionamentos gerados, também são

diferentes. No passo 3, o cilindro “A” deve avançar, já no passo 5, é o cilindro “C”

quem deve avançar.

Como combinações iguais devem gerar acionamentos iguais, o fato relatado

acima torna-se indesejável. Para solucionar tal situação, será inserido no circuito

outro elemento (relé), com o intuito de diferenciar os passos com mesma

combinação. Os contatos da bobina estarão acionados ou desacionados (1 ou 0),

dependendo do tipo de contato e da energização da bobina no instante considerado.

Por exemplo: Bobina ativada (1 ou K+) – Contato NA fechado (acionado) e, contato

NF aberto (desacionado); Bobina desativada (0 ou K-) – Contato NA aberto

(desacionado) e, contato NF fechado (acionado).

Para a obtenção das equações de acionamento dos elementos de trabalho,

deveriam ser utilizados, a princípio, dois relés para diferenciar os dois pares de

combinações iguais, no entanto, fazendo uma melhor análise na sequência dos

movimentos, constata-se que um único relé é o suficiente para diferenciar as

mesmas combinações.

É importante observar que no método seqüencial, a bobina do relé possui a

mesma função que um atuador, e seus vários contatos possuem a mesma função

que os sensores.

Como as comutações dos relés são muito rápidas, sua representação no

diagrama trajeto x passo é feita em forma de degrau.

A figura 6.3 apresentada a diagramação completa do método seqüencial.

80

Figura 6.3 – Diagramação completa do método sequencial

81

Analisando os diagramas da figura 6.3, podemos obter as seguintes equações

para cada cilindro pneumático:

Cilindro A: O comando do cilindro A será feito por uma válvula direcional

simples piloto.

A+ = b1.KNF e A– = b1.KNF

Cilindro B: O comando do cilindro B será feito por uma válvula direcional duplo

piloto.

B+ = c0.KNF e B– = a1.KNA

Cilindro C: O comando do cilindro C será feito por uma válvula direcional

simples piloto.

C+ = b0.KNA e C– = b0.KNA

6.4 Sistema eletropneumático

O método seqüencial para resolução de circuitos eletropneumáticos nos

permite, com o auxílio das equações de acionamento, visualizarmos com maior

facilidade algumas simplificações de projeto.

82

Nesse caso, foi possível utilizar válvulas direcionais simples solenóide para o

comando dos cilindros A e C.

A figura 6.4 apresenta o sistema eletropneumático do silo alimentador.

Figura 6.4 – Sistema eletropneumático do silo alimentador

6.5 Circuito elétrico de controle

No circuito elétrico de controle foram apresentados dois botões: o botão de

início, responsável por dar início ao ciclo de movimentos, e o botão de emergência,

que está relacionado à segurança do sistema.

Definimos que, nesse projeto, o sistema de segurança refere-se à

despressurização dos cilindros pneumáticos, uma vez acionado o botão de

emergência.

A figura 6.5 apresenta o circuito elétrico de controle do silo alimentador.

83

Figura 6.5 – Circuito elétrico de controle do silo alimentador

O sistema eletropneumático e o circuito elétrico de controle do silo alimentador

automático desenvolvido nesse capítulo sofreram modificações para se adequar às

características funcionais do módulo de reconhecimento de voz SR-07.

Os motivos e as soluções dessas modificações estão descritas

detalhadamente no capítulo seguinte.

84

CAPÍTULO 7: IMPLEMENTAÇÃO DO SISTEMA DE RECONHECIMENTO DE VOZ NO CIRCUITO ELÉTRICO DE CONTROLE

Para a implementação do sistema de reconhecimento de voz no circuito

elétrico de controle, fez-se necessário reconhecer o comportamento do módulo SR-

07, bem como, as características de emissão dos sinais, para a sua adequação

operacional aos circuitos eletropneumáticos. Geralmente os circuitos

eletropneumáticos são projetados da forma mais simplificada possível, desde que

satisfaça todas as exigências de projeto e de segurança. No entanto, é possível que

em muitos casos a adequação do circuito elétrico de controle venha proporcionar

também mudanças nos sistemas eletropneumáticos, tornando-os mais complexos.

É importante observar que quando uma palavra é reconhecida, o módulo SR-

07 envia um determinado sinal. Esse sinal permanece ativo enquanto outra palavra

não seja reconhecida, ou mesmo, enquanto não seja gerado algum código de erro

específico.

Levando-se em conta que a alternância dos comandos realizados pelos

locutores esteja satisfazendo as condições funcionais das sequências de

movimentos dos elementos de trabalho e, que o circuito transmissor e receptor

esteja sincronizado, pode-se concluir então, que as principais mudanças no circuito

elétrico de controle, bem como, em possíveis mudanças nos sistemas

eletropneumáticos, deverá ser tomada no sentido de avaliar o comportamento

operacional do circuito caso o módulo de reconhecimento de voz gere um código de

erro, ou seja, um “comando” inesperado que inevitavelmente desativará o sinal

anterior.

Uma característica importante a ser levada em consideração, é que toda a

comunicação entre esses dois circuitos é realizada por rádio freqüência, ou seja, se

houver disparidade entre o emissor e o receptor, pode haver perda do sinal enviado

pelo último comando reconhecido.

Outra característica do módulo SR-07 que deve ser levada em consideração

diz respeito aos comandos repetidos. Por exemplo, em acionamentos tradicionais

uma mesma válvula de botão (sem retenção) pode ser utilizada para dar início a

várias sequências de operações. No caso do módulo SR-07, a saída do sinal será

85

sempre retentora até a ocorrência de outro comando, ou seja, não ocorrerá

oscilação no sinal emitido ainda que o mesmo comando seja realizado

alternadamente.

Dessa forma, haverá sempre a necessidade de analisar a melhor maneira de

adequação do sistema de reconhecimento de voz nos circuitos eletropneumáticos

para a obtenção favorável dos resultados tanto a nível operacional, quanto a nível de

segurança.

A seguir foi analisada cada proposta de modificação do circuito

eletropneumático original

7.1 Adequação do sistema de segurança (botão de emergência)

No sistema eletropneumático tradicional do silo alimentador foi utilizado uma

válvula direcional (válvula de alimentação) de três vias e duas posições, acionada

por simples solenóide (normalmente aberta), com a finalidade de pressurizar os

elementos de comando.

Adotou-se como sistema de segurança nesse circuito a total despressurização

dos elementos de trabalho (cilindros “A”, “B”, e “C”). Para isso, uma válvula de botão

com trava (botão de emergência) deve ser acionada, energizando “YE”, de modo a

fechar a passagem de ar comprimido aos elementos de comando.

Ao desacionar o botão com trava, a válvula de alimentação retorna a sua

posição normal, os elementos de comando são novamente pressurizados e a

sequência de operação inicia-se de onde havia parado.

86

A figura 7.1 mostra o sistema eletropneumático tradicional descrito no capítulo

anterior.

Figura 7.1 – Acionamento de emergência no sistema eletropneumático

tradicional

Essa solução é bastante prática e eficiente, uma vez que toda a comunicação

com o solenóide “YE” da válvula de alimentação é realizada através do botão de

emergência.

Contudo, para a implementação do módulo de reconhecimento de voz SR-07

no circuito, houve a necessidade de modificar tanto o sistema eletropneumático,

quanto o circuito elétrico de controle.

É importante observar que o comando de voz “emergência” é suficiente para

enviar um sinal ao solenóide “YE”, e mantê-lo ativo. No entanto, qualquer outro

comando de voz, inclusive códigos de erro, desabilita “YE” fazendo com que o

circuito volte a funcionar.

Diante dessa situação, a válvula de alimentação do sistema eletropneumático

foi substituída por outra com acionamento duplo solenóide (válvula de memória),

com o intuito de solucionar a questão descrita acima.

A figura 7.2 mostra o sistema eletropneumático adaptado às características do

módulo SR-07.

87

Figura 7.2 – Adequação no acionamento de emergência do sistema

eletropneumático

Além disso, o circuito elétrico de controle deve garantir que apenas comandos

específicos habilitem e desabilitem a emergência.

A figura 7.3 mostra o circuito elétrico de controle adequado ao sistema

eletropneumático.

Figura 7.3 – Acionamento e desacionamento do sistema de emergência

Dessa forma, somente o comando “pressão” pode habilitar o solenóide “P”, e

somente o comando “emergência” pode habilitar o solenóide “E”. Como a válvula de

alimentação é uma válvula de memória, será sempre o último comando

(“emergência” ou “pressão”) que estará habilitado.

88

Esse procedimento garante que o sistema de emergência não sofrerá

influência de outros comandos, ou mesmo, influência sobre possíveis gerações de

códigos de erros do módulo de reconhecimento de voz SR-07.

7.2 Adequação do sistema de início de ciclo (botão de início)

Com relação ao sistema de partida da sequência de movimentos do silo

alimentador, a adequação ao circuito eletropneumático foi mais trabalhosa, no

entanto, as modificações propostas ocorreram apenas no circuito elétrico de

controle.

A figura 7.4 mostra o circuito elétrico de controle tradicional descrito no

capítulo anterior.

Figura 7.4 – Acionamento de partida do circuito elétrico de controle tradicional

A solução adotada no circuito original foi a de utilizar uma válvula de botão

(sem retenção para ciclo único, ou, com retenção para ciclos contínuos), associada

em série com o sensor “c0” (garantindo que o cilindro “C” esteja recuado) e com o

89

contato fechado da bobina “K”. Com o botão de início acionado ocorre a execução

da sequência dos movimentos dos cilindros pneumáticos, já com o botão

desacionado cessa-se o ciclo após o último movimento (recuo do cilindro “C”). É

importante notar que o início e o término do ciclo de movimentos estão centralizados

numa única ação externa (botão de início).

Na implementação do módulo de reconhecimento de voz no circuito elétrico

de controle foi necessário analisar alguns detalhes.

Primeiro: quando o comando de “início” for reconhecido, a sequência dos

movimentos inicia-se com ciclos contínuos, uma vez que o sinal emitido pelo módulo

SR-07 permanece ativo enquanto outro comando não seja reconhecido. Não há

nenhuma diferença operacional caso o mesmo comando de “início” seja repetido

intermitentemente durante o processo.

Segundo: caso um comando “fim” seja reconhecido, o comando de “início” é

desativado, e o ciclo de operações cessará após o último movimento. O problema, é

que qualquer outro comando diferente de “início” é suficiente para desativá-lo, ou

seja, também pode ser capaz de cessar o ciclo de operações.

Terceiro: caso o módulo de reconhecimento de voz SR-07 detecte uma

palavra não treinada, ou uma palavra muito curta, ou muito longa, será gerado um

código específico de erro, o que também é suficiente para desativar “início”, e

consequentemente cessar o ciclo de operações.

Dessa forma, há necessidade de pensar num sistema que necessariamente

utilize o comando “início” e “fim” para o início e término, respectivamente, do ciclo de

operações.

Afim de garantir que o início e o fim do ciclo de operações sejam realizados

nos momentos corretos, será implementado dois comandos específicos, utilizando-

se uma lógica de auto-retenção.

Quando o comando “início” for reconhecido, o contato fechado da bobina “K2”

permitirá que a bobina “K3” seja ativada, fechando seu contato. Dessa forma, o

solenóide “YB+” será energizado, dando início ao ciclo de operações. Ainda que

outro comando (diferente de “fim”) seja reconhecido, ou mesmo que algum código

de erro seja gerado (desativando “início”), o contato fechado “K3” manterá “YB+”

energizado.

90

Apenas quando o comando “fim” for reconhecido é que a bobina “K2” será

ativada, abrindo seu contato e desativando a bobina “K3”. O contato “K3” aberto

desativará “YB+”, cessando o ciclo de operações.

Dessa forma, somente quando o comando “início” for reconhecido novamente

é que o ciclo de operações reiniciará.

A figura 7.5 mostra o circuito elétrico de controle adaptado às características

do módulo SR-07.

Figura 7.5 – Adequação no acionamento de partida do circuito elétrico de

controle

7.3 Adequação do circuito eletropneumático ao módulo de

reconhecimento de voz SR-07

Quatro comandos do módulo de reconhecimento de voz SR-07 foram

implementados no circuito elétrico de controle. São eles: “início” – para dar início à

sequência do ciclo de operações; “fim” – para cessar o ciclo de operações; “pressão”

– para permitir que os elementos de comando e de trabalho sejam pressurizados;

“emergência” – para acionar o sistema de emergência e segurança do sistema.

91

O sistema eletropneumático e o circuito elétrico de controle adequado ao

módulo SR-07 são mostrados nas figuras 7.6 e 7.7.

Figura 7.6 – Sistema eletropneumático do silo alimentador adequado ao

módulo SR-07

Figura 7.7 – Circuito elétrico de controle do silo alimentador adequado ao

módulo SR-07

92

Com a implementação da lógica de auto-retenção, fica assegurado que os

comandos “início” e “fim” sejam de fato os responsáveis pelo início e término do ciclo

de operações, independentemente de outro comando realizado ou código de erro

gerado, durante a movimentação dos cilindros.

No caso do comando “emergência” ser reconhecido durante a execução do

ciclo de operações, imediatamente todos os cilindros serão despressurizados

(atendendo a condição de segurança imposta nesse caso específico).

Posteriormente, ao ser reconhecido o comando “pressão”, os cilindros serão

realimentados, reiniciando a sequência de operações de onde havia parado.

Excepcionalmente nessa situação, ao término do último movimento, o ciclo será

cessado, e ficará aguardando um novo comando de “início”.

7.4 Testes experimentais na bancada de simulação

Para a validação do projeto foram realizados testes experimentais no

laboratório de pneumática e hidráulica do departamento de Engenharia Mecânica da

Universidade de Taubaté.

Foi utilizada uma bancada de simulação, componentes pneumáticos e

eletropneumáticos produzidos pela Parker, conforme mostra a figura 7.8.

Os comandos “início”, “fim”, “pressão” e “emergência” foram devidamente

treinados no sistema dependente de locutor.

Os testes iniciais foram realizados de forma que o locutor esteve a uma

distância aproximada de 1,5 metros da bancada. Posteriormente essa distância foi

aumentada para aproximadamente 4 metros.

Notou-se que, quando aumentou a distância entre os dois circuitos

(transmissor e receptor) houve uma diferença considerável no tempo entre o

comando propriamente dito e a ação de movimento dos cilindros pneumáticos.

Enquanto nos primeiros testes (1,5 metros de distância) a resposta do sistema não

apresentou retardo significativo, o mesmo não ocorreu nos testes subseqüentes (4

93

metros de distância), chegando a registrar atraso de resposta num tempo em torno

de 3 segundos.

Dessa forma, além do desempenho do circuito eletropneumático estar

diretamente relacionado ao próprio desempenho do módulo de reconhecimento de

voz, está também diretamente relacionado ao desempenho dos circuitos transmissor

e receptor.

Enquanto um baixo desempenho do módulo de reconhecimento de voz pode

ocasionar falha na sequência de operações previstas dos cilindros pneumáticos (no

sentido de não executar uma ação previamente requerida pelo comando), um baixo

desempenho na transmissão e recepção dos sinais de rádio freqüência pode

ocasionar retardos significativos entre o comando e a ação.

Figura 7.8 – Bancada de simulação

94

Observou-se também que quando o módulo SR-07 gerou código de erro a um

determinado comando, o circuito eletropneumático agiu como o previsto, não sendo

influenciado por esse erro. Nesse caso, necessariamente o comando de voz teve

que ser repetido.

Os comentários finais e a conclusão do trabalho serão apresentados no

capítulo seguinte.

95

CAPÍTULO 8: COMENTÁRIOS E CONCLUSÕES

Nesse trabalho foi analisado e implementado um sistema de reconhecimento

de voz num circuito elétrico de controle de um circuito eletropneumático, para que

válvulas de comando pudessem ser acionadas à distância, proporcionando uma

sequência de movimentos pré-estabelecidos em cilindros pneumáticos em função do

comando ativado pela voz.

Todas as etapas dessa implementação foram percorridas, desde a escolha e

obtenção do módulo de reconhecimento de voz que foi utilizado (dando ênfase a

testes experimentais a fim de analisar seu desempenho), passando pela descrição e

desenvolvimento de um circuito eletropneumático (utilizado como modelo de testes e

como ponto de partida para adequação às características do módulo de

reconhecimento de voz), até a adequação propriamente dita entre o módulo e o

circuito elétrico de controle, além de ter projetado dois circuitos elétricos, um

transmissor e um receptor de rádio freqüência (wireless).

Como toda ação do sistema eletropneumático proposto deu-se a partir de

comandos de voz à distância, percebeu-se que o desempenho desse sistema estava

diretamente relacionado ao desempenho do próprio módulo de reconhecimento e da

qualidade de transmissão e recepção desses comandos. Diante desse fato, tornou-

se necessário avaliar o desempenho do módulo SR-07 (módulo de reconhecimento

de voz utilizado), verificando o tipo de ambiente e em qual nível sonoro ele pode ser

submetido, de forma a operar mantendo um nível de eficiência apropriado.

A partir dos resultados obtidos, pôde-se constatar e concluir que o melhor

desempenho do módulo de reconhecimento de voz SR-07 ocorreu nos sistemas

dependentes de locutor, operando em ambientes com variação de nível sonoro entre

50 dB e 65 dB (+/- 3 dB), desde que os ruídos externos não apresentem oscilações

excessivas de pico nas amplitudes das ondas sonoras (com “volume” estável dentro

da faixa de nível sonoro pré-estabelecido), minimizando o efeito de coarticulação. O

desempenho do módulo SR-07 nessas condições foi de 95,9%, entre palavras

treinadas, ou não.

96

Constatou-se ainda que em ambientes com nível sonoro acima de 68 dB, o

módulo SR-07 torna-se totalmente instável e inoperante.

Na categoria de independência de locutor foram constatados os piores

desempenhos, registrando índice de acertos para palavras treinadas de apenas

24,5% em ambientes similares ao descrito acima.

Foi proposta uma metodologia para simular a utilização do módulo SR-07 em

sistemas independentes de locutor, mantendo o desempenho de dependência de

locutor (95,9%). A metodologia baseou-se numa característica de construção do

circuito elétrico transmissor, especificamente onde ocorreu a interceptação do sinal

elétrico enviado ao visualizador digital (junto ao circuito integrado responsável pelo

dígito das unidades do número associado ao comando).

A metodologia permite que locutores diferentes realizem o treinamento dos

mesmos comandos, associando números diferentes aos comandos (desde que o

dígito das unidades do número associado ao comando seja o mesmo). Essa

simulação de independência de locutor é restrita apenas aos locutores que

realizaram os treinamentos.

Desenvolveu-se dois circuitos elétricos (transmissor e receptor) de acordo

com as características técnicas e funcionais tanto do módulo SR-07, quanto do

circuito eletropneumático, com o objetivo de ser o “elo” entre o módulo de

reconhecimento de voz e o circuito elétrico de controle.

Em relação ao circuito eletropneumático, com o intuito de obter uma

sequência de movimentos por parte dos cilindros pneumáticos que não fossem

aleatórios, foi elaborado um modelo que atendesse aos requisitos de automatização

de um silo alimentador automático de grãos, e a partir daí, desenvolvido um circuito,

utilizando-se um método tradicional para resolução de problemas, denominado,

“método seqüencial”.

Como as características funcionais do circuito eletropneumático desenvolvido

tradicionalmente não estavam compatíveis com as características funcionais do

módulo SR-07, foram necessários a realização das devidas adequações. Dessa

forma, foram propostas algumas modificações, em especial, a garantia que apenas

comandos específicos realizassem ações associadas, e que códigos de erros

gerados pelo módulo SR-07 não interferissem na sequência de operações.

97

Montou-se uma simulação na bancada experimental a fim de validar o projeto.

Vários testes com comandos de voz diferentes a diferentes distâncias (entre o

módulo SR-07 e o circuito elétrico de controle) foram realizados obtendo êxito no

resultado final.

Em função dos resultados satisfatórios nas simulações realizadas, conclui-se

que o projeto desenvolvido pode ser perfeitamente utilizado nos processos de

automatização eletropneumáticos do setor industrial, particularmente nas situações

em que tais processos se encaixem nas características técnicas desse projeto.

Evidentemente, melhorias podem ser realizadas, o que certamente produzirá

avanços no desempenho do sistema.

Como sugestões para trabalhos futuros, podem-se citar o desenvolvimento de

um módulo de reconhecimento de voz mais apropriado às configurações

empregadas no setor industrial, visando melhores desempenhos, especialmente

quanto ao efeito de coarticulação, uma vez que ambientes fabris normalmente não

são ambientes silenciosos.

Também poderiam ser estudados metodologias de resolução de problemas

eletropneumáticos, tomando como base as características funcionais do módulo de

reconhecimento de voz adotado, a fim de que o resultado obtido possa ser direto,

sem a necessidade de realizar adequações específicas.

Finalmente, sugere-se que sejam realizadas aplicações práticas em vários

setores, tais como, no próprio setor industrial em geral, na automação predial, em

equipamentos que visem melhorar o cotidiano de pessoas portadoras de

necessidades especiais, ou mesmo, na melhoria do conforto das pessoas em geral,

nos ambientes hospitalares em equipamentos que possam ser automatizados, nas

clínicas (odontológicas, ortopédicas, por exemplo), no setor de entretenimento, nos

parques de diversão, etc.

98

REFERÊNCIAS

1. BOLLMANN, Arno. Fundamentos da Automação Industrial Pneutrônica, projeto de comandos binários eletropneumáticos. São Paulo: ABHP,1997.

2. BONACORSO, N.G., NOLL, V. Automação Eletropneumática. 5a edição. São Paulo: Editora Érica Ltda, 2001.

3. BOYLESTAD, Robert L.; tradução: José Lucimar do Nascimento; revisão técnica: Antonio Pertence Júnior. Introdução a análise de circuitos. 10a Ed. São Paulo: Pearson Prentice Hall, 2004.

4. DIAS, R.S.F., “Normalização de locutor em sistema de reconhecimento de fala”, Dissertação de mestrado – Universidade estadual de camplinas, UNICAMP, Novembro de 2000.

5. FERREIRA, Vicente José Fernandes Costa, “Projeto de um circuito eletropneumático com regulagem da pressão para o processo de execução de furos circulares em chapas metálicas com variação de espessuras”, Artigo – Rev. ciênc. Exatas, Taubaté, v. 13, n. 1, p. 113-120, 2007.

6. FIALHO, A.B. Automação Pneumática – Projetos, Dimensionamento e Análise de Circuitos. 6a edição. São Paulo: Érica, 2007.

7. GUILHOTO, P.J.S., ROSA, S.P.C.S., “Reconhecimento de voz”, Trabalho de síntese no âmbito da licenciatura em engenharia informática – Departamento de engenharia Informática, Universidade de Coimbra, Novembro de 2001.

8. HAYKIN, Simon. Sistemas de comunicação: analógicos e digitais. 4a edição. Porto Alegre: Bookman, 2004.

9. LIMA, A.A., FRANCISCO, S.L., NETTO, S.L., JÚNIOR, F.G.V.R., “Análise comparativa de parâmetros em sistemas de reconhecimento de voz”, XVIII Simpósio Brasileiro de Telecomunicações, 3 a 6 de Setembro, 2000, Gramado-RS.

99

10. MARQUES, Angelo Eduardo B., CRUZ, Eduardo Cesar Alves, JÚNIOR, Salomão Choueri. Dispositivos Semicondutores: Diodos e transistores. 8a Ed. São Paulo: Érica, 2002.

11. MONTEIRO, Luís Carlos Castro, “Reconhecimento de voz: Sistema de reconhecimento do orador, baseado em modelos de Markov, compactado num objecto COM para Windows”, Dissertação de mestrado – Universidade do Minho, Guimarães, 2007.

12. PARKER HANNIFIN TRAINING, Tecnologia Eletropneumática Industrial, Apostila M1002-2 BR, Outubro 2002.

13. RX-D1. “Datasheet”. Modelo RX-D1, fabricante RoHs http://www.spiriton.com.tw/download/RxD1specification.pdf. Acessado em 18 fev. 2011, 16h04 min.

14. SOUZA, Marco Antonio Firmino, “Uma plataforma para a cooperação autônoma de múltiplos robôs”, Dissertação de mestrado – Instituto Militar de Engenharia – IME, Rio de Janeiro, 2008.

15. SR-06/SR-07, Speech Recognition Kit – Construction Manual & User Guide.

16. TEVAH, Rafael Teruszkin, “Implementação de um sistema de reconhecimento de fala contínua com amplo vocabulário para o Português Brasileiro”, Dissertação de mestrado – Universidade federal do Rio de Janeiro, COPPE, Junho de 2006.

17. TOCCI, Ronald J., WIDMER, Neal S., MOSS, Gregory L.; tradução: Cláudia Martins; revisão técnica: João Antonio Martino. Sistemas digitais: princípios e aplicações. 10a Ed. São Paulo: Pearson Prentice Hall, 2007.

18. TX-C1. “Datasheet”. Modelo TX-C1, fabricante RoHs http://www.spiriton.com.tw/download/TX-C1%20specification.pdf. Acessado em 18 fev. 2011, 16h14 min.

19. YNOGUTI, C.A., “Reconhecimento de fala contínua usando modelos ocultos de Markov”, Tese de doutorado – Universidade estadual de Campinas, UNICAMP, Maio de 1999.

http://www.spiriton.com.tw/download/RxD1specification.pdf

http://www.spiriton.com.tw/download/TX-C1%20specification.pdf

100


O objetivo desse apêndice é apresentar de forma sucinta uma descrição

acerca das principais características dos sistemas eletropneumáticos, seus

elementos mais comuns, simbologias e funções.

A eletropneumática é uma importante tecnologia dentro do contexto da

automação industrial e precursor da pneumática. O termo pneumática é derivado do

grego Pneumos ou Pneuma (respiração, sopro) e é definido como a parte da Física

que se ocupa da dinâmica e dos fenômenos físicos relacionados com os gases ou

vácuos. É também o estudo da conservação da energia pneumática em energia

mecânica, através dos respectivos elementos de trabalho (PARKER, 2002).

Dessa forma, na eletropneumática, o ar comprimido possui a função de

proporcionar energia aos atuadores pneumáticos a fim de realizarem trabalho.

Como a eletropneumática utiliza uma combinação da energia pneumática com

a energia elétrica, há a necessidade de se ter um circuito elétrico como elemento de

controle. O elemento de controle é um circuito elétrico que combina as informações

fornecidas pelos sensores elétricos juntamente com a sequência de operação,

gerando o acionamento elétrico para os elementos de comando (BONACORSO,

2001).

Estrutura de um sistema eletropneumático

O projeto de um circuito eletropneumático requer um pensamento lógico e a

escolha de uma metodologia de resolução apropriada, em função da natureza de

cada problema.

Num circuito eletropneumático, os elementos de sinal são sensores elétricos

que enviam informações contínuas sobre a evolução do processo automatizado ao

elemento de controle.

101

Os elementos de trabalho são aqueles que efetivamente produzirão

movimentos, sejam rotacionais ou lineares, como por exemplo, motores elétricos,

motores pneumáticos e atuadores (cilindros) pneumáticos. Ao produzirem

movimentos, os elementos de trabalho acionam os elementos de sinal.

Os elementos de comando são os responsáveis por acionarem os elementos

de trabalho, através de válvulas eletropneumáticas pilotadas por solenóides, relés e

contatores.

Os elementos de controle são o próprio circuito elétrico responsável por

acionar os elementos de comando.

Figura A.1 – Diagrama de um circuito eletropneumático automatizado

102

Principais elementos de trabalho que compõem um sistema

eletropneumático

Os principais elementos de trabalho de um sistema eletropneumático são os

cilindros de simples ação, os cilindros de dupla ação e os cilindros rotativos.

Os cilindros de simples ação são componentes pneumáticos caracterizados

por realizarem trabalho apenas no avanço (ou apenas no retorno) da haste do

cilindro. O retorno (ou avanço) da haste é realizado por ação da força de uma mola

posicionado na câmara dianteira (ou traseira) do cilindro.

Tais cilindros são aplicados especialmente em operações que envolvam

fixação, expulsão, extração, prensagem entre outras.

(a) (b)

Figura A.2 – Simbologia do cilindro de simples ação. (a) Retorno por ação de

mola; (b) Avanço por ação de mola.

Os cilindros de dupla ação são componentes pneumáticos caracterizados por

realizarem trabalho tanto no avanço quanto no retorno da haste do cilindro. Esses

cilindros apresentam uma larga aplicação nos setores industriais.

É importante ressaltar que, para uma mesma pressão de trabalho, a força

produzida pelo cilindro nos seus movimentos de avanço e retorno não são iguais (a

força produzida no avanço é normalmente maior que a força produzida no retorno),

103

devido ao fato das áreas efetivas de atuação de pressão serem diferentes, nas

câmaras traseiras e dianteiras do cilindro.

Como o volume de ar comprimido na câmara dianteira do cilindro (com a

haste totalmente recuada), é ligeiramente menor que o volume de ar da câmara

traseira (com a haste totalmente avançada), a velocidade de avanço da haste do

cilindro é normalmente inferior à velocidade de recuo.

Figura A.3 – Simbologia do cilindro de dupla ação

Os cilindros rotativos são cilindros que convertem movimentos lineares em

movimentos rotacionais. A haste do êmbolo do cilindro possui um perfil dentado

acoplado a uma engrenagem. Com o movimento linear da haste, para a direita ou

esquerda, ocorre simultaneamente o movimento rotacional da engrenagem, ora no

sentido horário, ora no sentido anti-horário.

Esse tipo de cilindro é projetado para realizarem rotações (cursos) definidos,

como por exemplo, ângulos de 90o, 180o, 270o, etc.

Figura A.4 – Simbologia do cilindro rotativo

104

Válvulas eletropneumáticas de controle direcional

Nos sistemas eletropneumáticos, as válvulas de controle direcionais são

utilizadas como elemento de comando. Sua função é a de direcionar o fluxo de ar

comprimido, de forma que os elementos de trabalho possam realizar seus

movimentos.

Para um perfeito entendimento das características das válvulas de controle

direcional, é fundamentalmente importante conhecer as seguintes informações:

posição inicial, número de posições, número de vias, tipo de acionamento, tipo de

retorno e vazão. O conhecimento do tipo de construção desses componentes

também é importante, principalmente para uma melhor adequação desta em

diferentes tipos de projetos.

Basicamente, esse tipo de válvula funciona a partir do deslocamento

(comutação) de um núcleo metálico sob a ação de um campo magnético, produzido

pela presença de corrente elétrica no solenóide da válvula.

A seguir, será feito uma breve menção a respeito do funcionamento de

algumas válvulas de controle direcional que compõem um circuito eletropneumático,

identificando sua respectiva simbologia.

Válvula eletropneumática de controle direcional, 3 vias, 2 posições,

simples solenóide, normal fechada (NF)

Trata-se de uma válvula normalmente utilizada para o comando de um cilindro

de simples ação, por possuir apenas uma saída de ar comprimido “A”. Na sua

posição normal (posição de repouso), o ar comprimido que entra em “P”, está

bloqueado.

Ao acionar o solenóide “Y”, ocorre a comutação da válvula (mudança de

posição), e o ar comprimido flui para a saída “A”. Quando o solenóide “Y” perde sua

105

energização, a válvula retorna (por ação da força da mola) à sua posição inicial, e o

ar comprimido que estava em “A” retorna à atmosfera através da conexão “R”.

Figura A.5 – Simbologia da válvula (3/2 vias)


simples solenóide

Trata-se de uma válvula normalmente utilizada para o comando de um cilindro

de dupla ação, por possuir duas saídas de ar comprimido “A” e “B”. Na sua posição

normal (posição de repouso), o ar comprimido que entra em “P”, flui para a conexão

de saída “B”. Além disso, o ar comprimido que estava em “A”, retorna à atmosfera

através da conexão “R”.


A

Y

P R

A B

Y

P R

106

Ao acionar o solenóide “Y”, ocorre a comutação da válvula, e o ar comprimido

que está entrando em “P”, flui para a saída “A”. O ar comprimido que estava em “B”,

retorna à atmosfera, também por “R”.

Quando o solenóide “Y” perde sua energização, a válvula retorna (por ação da

força da mola) à sua posição inicial. O ar que estava em “A”, retorna à atmosfera por

“R”, e a conexão “B” se pressuriza novamente.


duplo solenóide

Essa válvula também é normalmente utilizada para o comando de um cilindro

de dupla ação. Quando o solenóide “Y1” é energizado, o ar comprimido que entra em

“P” flui para a conexão “A”, enquanto o ar que se encontrava em “B”, retorna à

atmosfera através de “S”.

Quando o solenóide “Y1” perde sua energização, e “Y2” é energizado, ocorre a

comutação da válvula, e o ar comprimido que entra em “P” flui para a conexão “B”,

enquanto o ar que se encontrava em “A”, retorna à atmosfera através de “R”.

É importante observar que não ocorra energização simultânea nos solenóides

“Y1” e “Y2”.


A B

Y1 Y2

R S

P

107

Dispositivos de comando elétrico

São elementos de comutação destinados a permitir ou não a passagem da

corrente elétrica entre um ou mais pontos de um circuito (BONACORSO, 2001).

Os dispositivos de comando elétrico utilizados nos circuitos eletropneumáticos

são normalmente classificados em: elementos de entrada de sinais elétricos,

elementos de processamento de sinais elétricos e elementos de saída de sinais

elétricos.

Elementos de entrada de sinais elétricos

Os elementos de entrada de sinais elétricos são caracterizados por enviarem

sinais (informações) ao circuito mediante a aplicação de força externa, podendo ser

muscular, mecânica, eletrônica ou uma combinação dessas.

Entre os elementos de entrada de sinais elétricos, podem-se destacar: As

botoeiras, que são chaves elétricas acionadas manualmente, e que geralmente

possuem um contato aberto e outro fechado; As chaves fim de curso, que são

comutadores elétricos acionados mecanicamente, geralmente posicionadas no

percurso de cabeçotes móveis; Os sensores de proximidade, que são comutadores

elétricos geralmente posicionados no percurso de cabeçotes móveis. Seu

acionamento não depende de um contato físico entre as partes móveis, bastantando

apenas uma aproximação (a distância de aproximação depende do tipo de sensor

utilizado); E os pressostatos, também conhecido como sensores de pressão, cuja

função é a de registrar tanto o acréscimo, quanto a queda de pressão nas linhas de

pressão.

108

Figura A.8 – Exemplos de elementos de entrada de sinais elétricos e suas

respectivas simbologias. (a) botão pulsador tipo cogumelo, (Parker); (b) chave fim de

curso tipo gatilho, (Parker); (c) sensor capacitivo, (Parker); (d) pressostato, (Parker).

Elementos de processamento de sinais elétricos

Os elementos de processamento de sinais elétricos são caracterizados por

receberem as informações dos elementos de entrada, “analisá-las” e enviá-las aos

elementos de comando, de forma que o comportamento final do sistema se

apresente como o requerido no desenvolvimento do processo de automatização.

(a) (b)

(c) (d)

109

Figura A.9 – Exemplos de elementos de processamento de sinais elétricos e

suas respectivas simbologias. (a) relé auxiliar com contatos comutadores, (Parker);

(b) relé temporizador com retardo na energização, (Parker); (c) contador

predeterminador, (Parker).

Entre os elementos de processamento de sinais elétricos, podem-se destacar:

os relés auxiliares, que são chaves elétricas acionadas por bobinas

eletromagnéticas. Quando a bobina é energizada, ocorre uma inversão imediata nos

seus contatos; Os relés temporizadores, que são também conhecidos como relés de

tempo, são chaves elétricas acionadas por bobinas eletromagnéticas, no entanto,

quando a bobina é energizada, um potenciômetro retarda o acionamento do contato

comutador; Os contatores de potência, que são chaves de comutação

eletromagnética (assim como os relés). No entanto, são dimensionados para

suportarem cargas elétricas elevadas (ao contrário dos relés que suportam cargas

de pequena potência); Os contadores, que são relés contadores programados para

receberem determinada quantidade de pulsos elétricos.

(a) (b)

(c)

110

Elementos de saída de sinais elétricos

Os elementos de saída de sinais elétricos são caracterizados por realizarem

algum tipo de efeito após receberem um sinal previamente processado.

Entre os elementos de saída de sinais elétricos, podem-se destacar: Os

indicadores luminosos, que são normalmente lâmpadas incandescentes ou LEDs;

Os indicadores sonoros, que são normalmente sirenes ou campainhas; Os

solenóides, que são bobinas capazes de gerar um campo magnético quando

energizadas, funcionando como imãs.

Figura A.10 – Exemplos de elementos de saída de sinais elétricos e suas

respectivas simbologias. (a) sinalizadores luminosos e sonoros, (Parker); (b)

solenóides, (Parker).

Metodologias de resolução de circuitos eletropneumáticos

Existem atualmente algumas metodologias utilizadas para a resolução de

circuitos eletropneumáticos. Dentre eles, destacam-se o método intuitivo e o método

seqüencial.

(a) (b)

111

Na técnica de elaboração de circuitos eletropneumáticos pelo método intuitivo

utiliza-se o mecanismo do pensamento e do raciocínio humano na busca da solução

de uma situação-problema apresentada. Dessa forma, pode-se obter diferentes

soluções para um mesmo problema em questão, característica principal do método

intuitivo (PARKER, 2002).

O método seqüencial consiste em definir as equações de acionamento dos

elementos de trabalho, mediante a comparação do diagrama de comando dos

atuadores com o de atuação dos sensores (BONACORSO, 2001).

Dessa forma, utilizando-se o método seqüencial, as soluções encontradas

para um mesmo problema e realizadas por pessoas diferentes, deverão se

apresentar de formas semelhantes.

O diagrama de comando dos atuadores (diagrama Trajeto x Passo) é uma

forma simplifica de representar a ordem dos movimentos, em conformidade com a

sequência requerida pelo projeto em desenvolvimento. O diagrama de atuação dos

sensores representa quais os momentos da sequência dos movimentos, eles

estarão acionados.

112

APÊNDICE B – LAYOUT (CIRCUITO IMPRESSO TRANSMISSOR)

Esse apêndice mostra o layout superior e inferior do circuito impresso do

transmissor.

113

APÊNDICE C – LAYOUT (CIRCUITO IMPRESSO RECEPTOR)

Esse apêndice mostra o layout superior e inferior do circuito impresso do

receptor.

114


115

116


117

118

119

Autorizo cópia total ou parcial desta obra,

apenas para fins de estudo e pesquisa,

sendo expressamente vedado qualquer tipo

de reprodução para fins comerciais sem

prévia autorização específica do autor.

Vaslei Gil Balmant

Taubaté, março/2011.

Documents

Acionamento a distância de circuitos eletropneumáticos por reconhecimento …bdtd.unitau.br/tedesimplificado/tde_arquivos/5/TDE-2012-09... · interceptados por um circuito eletrônico,