Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/OCR/Tesseract

Preview:

Citation preview

Multimídia

Richiely Batista de Moura Paiva.

Vinícius Bulhões.

Vinícius Nunes

Sistema de Reconhecimento

OCR

Reconhecendo e extraindo

características em placas de carros

Sumário

1.

1. Proposta

2. Revisão Bibliográfica

3. Métodos utilizados

4. Exemplo e demonstração da proposta

Proposta

Sistema de Reconhecimento OCR

Reconhecimento de caracteres de uma origem, seja uma

imagem, foto ou uma placa de carro.

Ferramentas:

● OpenCV e Tesseract

Proposta

Desafios

● Entendimento da API Tesseract

● Tratamento de imagens

○ Métodos necessários para o desenvolvimento.

■ Localizar o texto na

imagem;

■ Isolar o texto do

‘background’;

■ Alinhar o texto extraído;

■ Retirar os ruídos e coisas

indesejáveis;

■ Aquisição do texto final. ● Obter texto editável

Artigos relacionados BASSIL, Y., ALWANI, M. OCR Post-Processing Error Correction algorithm

using Google’s Online Spelling Suggestion. LACSC – Lebanese

Association for Computational Sciences january 2012.

ALVES, W. A. L. et al. Uma abordagem para localização e reconhecimento

de placas de licenciamento veicular por meio de operadores

morfológicos e busca por template. Exacta, São Paulo, v. 9, n. 3, p. 355-

362, 2011.

CONCI, A., HISS MONTEIRO, L. Reconhecimento de Placas de Veículos

por Imagem.

FARUK, A., MANJUMDER, N., BASU, S., NASIPURI, M. Design of an Optical

Character Recognition System for Camerabased Handheld Devices. IJCSI

International Journal of Computer Science Issues, july 2011

OCR Post-Processing Error Correction

algorithm using Google’s Online Spelling

Suggestion

• Demonstração do OCR sobre um

documento qualquer;

• Digitalização;

• Reconhecimento das características

• Extração do texto;

• Correção de erros com o mecanismo de

sugestão do Google.

OCR Post-Processing Error Correction

algorithm using Google’s Online Spelling

Suggestion

• Alguns erros de reconhecimento

• OCR pode confundir uma letra ‘S’ com o

número ‘5’ ou o ‘B’ com o número ‘8’.

• Correção baseada no contexto e dicionário

(abrange todas as palavras do vocabulário

específico).

OCR Post-Processing Error Correction

algorithm using Google’s Online Spelling

Suggestion

Uma Abordagem para Localização e Reconhecimento

de Placas de Licenciamento Veicular por meio de

Operadores Morfológicos e Busca por Template

• Localização e reconhecimento da placa

na imagem.

• Encontrar a posição da placa;

Operações com a largura e altura dos

caracteres.

Geometria da fonte - distância dos caracteres.

• Template matching;

Comparação com placas previamente

catalogadas.

• Característica extraída.

Reconhecimento de Placas de Veículos por

Imagem

• Abordagem de técnicas de tratamento e

transformações da imagem.

• Binarização - treshold;

• Dilatação;

• Erosão;

• Segmentação;

Design of an Optical Character Recognition

System for Camerabased Handheld Devices

• Motivação principal: digitalização de

imagens, principalmente documentos;

• Segmentação feita a partir da linha do

texto;

• Como reconhecer os caracteres?

Design of an Optical Character Recognition

System for Camerabased Handheld Devices

Entendimento dos métodos

Métodos necessários para a

resolução do problema ●

● Binarização

● Segmentação

● Template matching

● Reconhecimento de caracteres

Binarização

● A intensidade da imagem passa a ter apenas dois

níveis distintos, para que possamos separar o objeto do

fundo da imagem. Esse método pode ser descrito

através da aplicação da função s = T(r).

● A função T(r) compara o sinal de entrada com um valor

de threshold (T), escolhido como referência para a

separação dos níveis de cinza. O sinal de saída,

apresentado é obtido pela relação:

s = {1 para r > T ou 0 para r < T}.

Segmentação

● A segmentação é o processo de dividir uma imagem

em regiões, ou objetos. Em outras palavras, a

segmentação simples consistem em localizar objetos e

formas em imagens.

● O uso desta técnica em nossa proposta será para

podermos reconhecer na imagem aonde estão os

caracteres.

Template matching

● Através de um padrão, conseguir indentificá-lo, caso

ele apareca, em alguma imagem qualquer.

● Será usado para dizer qual caractere foi encontrado,

comparando o caractere segmentado da imagem

analisada com algum banco de padrões, para que o

mesmo possa ser reconhecido.

○ Cuidado na hora de reconhecer caracteres e

números. A letra ‘S’ pode ser confundida com o

número ‘5’ ou a letra ‘O’ pode ser confundida com o

número ‘0’.

Reconhecimento de caractere

● O reconhecimento de caracteres é a técnica do OCR.

Permite converter imagens com texto em documentos

de texto usando algoritmos de computação

automatizados. As imagens podem ser processadas

individualmente (arquivos .jpg, .png e .gif) ou em

documentos PDF com várias páginas (.pdf).

Tratamento da imagem

● Texto encontrado na imagem

● Separação com o background

● Segmentação e binarização

Tratamento da imagem

• Isolamento da região que contem a placa

• Extração do texto contido na placa

Processos Realizados

• Isolamento da região que contem a placa Original:

TopHat:

Processos Realizados

• Isolamento da região que contem a placa Binarização :

Fechamento EE horizontal linear:

Processos Realizados

• Isolamento da região que contem a placa Abertura altura máxima e minima :

Abertura Largura máxima e minima:

Processos Realizados

• Isolamento da região que contem a placa Dilatação e remoção de possíveis ruídos :

Seleção placa:

Processos Realizados

• Isolamento da região que contem a placa Recorte da placa:

Processos Realizados

• Extração do texto contido na placa Binarização

Erosão

Processos Realizados

• Extração do texto contido na placa Dilatação

Smooth

Processos Realizados

Demonstração

Sistema de Reconhecimento de placas com

OCR

Alunos:

Richiely Batista

Vinícius Bulhões

Vinícius Nunes

Recommended