Visão Computacional - UFFjulius/icc/vcomp.pdfVisão Computacional • Ciência e tecnologia das...

Preview:

Citation preview

Visão Computacional

Prof. Leandro Augusto Frata Fernandes

laffernandes@ic.uff.br

TCC-00.169 Introdução à Ciência da Computação (2012.2)

Visão Humana

• Responsável por cerca de 75%

de nossa percepção

• O ato de ver é resultado de

Operações ópticas

Operações químicas

Operações nervosas

TCC-00.169 Introdução à Ciência da Computação (2012.2) 2

Visão Humana

• Os olhos são órgãos responsáveis por

Captar informação luminosa

Transformá-la em impulsos a serem

decodificados pelo sistema nervoso

• Os impulsos são depurados durante

todo o trajeto através do sistema visual

• A visão é feita pelo cérebro

Depende de experiência e interpretação

TCC-00.169 Introdução à Ciência da Computação (2012.2) 3

Visão Computacional

• Ciência e tecnologia das máquinas que veem

• Objetivo

Programar o computador para entender a cena ou

elementos em uma imagem

TCC-00.169 Introdução à Ciência da Computação (2012.2) 4

Um computador não é capaz de encontrar uma

bicicleta, ônibus, pessoa ou guarda chuva

sem interpretar o conteúdo do reticulado

Uma imagem é nada mais que um

reticulado colorido de “pixels”

Visão Computacional

• Ciência e tecnologia das máquinas que veem

• Objetivo

Programar o computador para entender a cena ou

elementos em uma imagem

• Estuda-se

Métodos para aquisição, processamento, análise e

compreensão de imagens

Dados multidimensionais do mundo real para produzir

informação numérica ou simbólica na forma de decisão

TCC-00.169 Introdução à Ciência da Computação (2012.2) 5

Aplicações de

Visão Computacional

TCC-00.169 Introdução à Ciência da Computação (2012.2) 6

Robótica

Veículos Autônomos

Google Driverless Car

Organização de Informação

Recuperação de Imagem Baseada em Conteúdo

Technique 1

Technique 3

Technique 2

Aplicações de

Visão Computacional

TCC-00.169 Introdução à Ciência da Computação (2012.2) 7

Indústria

Controle de Qualidade

Reconhecimento e Medição de Objetos

Interação Humano-Computador

Dispositivos de Entrada

Reconhecimento de Mão e Gestos

Medicina

Auxílio no Diagnóstico de Doenças

Segmentação Automática de Tumor na Mama

Roteiro da Apresentação

• Fundamentos

• Exemplo Prático

Detecção de retas em imagens

• Visão Computacional em Ciência da Computação

Classificação da área

Campos relacionados

• Considerações Finais

TCC-00.169 Introdução à Ciência da Computação (2012.2) 8

Fundamentos

TCC-00.169 Introdução à Ciência da Computação (2012.2) 9

Hierarquia de um Sistema Geral de

Visão Computacional

TCC-00.169 Introdução à Ciência da Computação (2012.2) 10

Entrada Sensorial

Semântica

Percepção

Normalização Análise

Bidimensional

Recuperação de

Parâmetros Físicos

Agrupamento Reconhecimento de

Objetos, Cenas e Eventos

Hierarquia de um Sistema Geral de

Visão Computacional

TCC-00.169 Introdução à Ciência da Computação (2012.2) 11

Entrada Sensorial

Semântica

Normalização Análise

Bidimensional

Recuperação de

Parâmetros Físicos

Agrupamento Reconhecimento de

Objetos, Cenas e Eventos

Percepção

A etapa de percepção

obtém imagens de

um ou mais sensores

Hierarquia de um Sistema Geral de

Visão Computacional

TCC-00.169 Introdução à Ciência da Computação (2012.2) 12

Percepção

Análise

Bidimensional

Recuperação de

Parâmetros Físicos

Agrupamento Reconhecimento de

Objetos, Cenas e Eventos

Entrada Sensorial

Semântica

Normalização

Imagens do MAC de Niterói

Note as diferenças

entre elas

A etapa de normalização

tenta diminuir as diferenças

Hierarquia de um Sistema Geral de

Visão Computacional

TCC-00.169 Introdução à Ciência da Computação (2012.2) 13

Percepção

Normalização

Recuperação de

Parâmetros Físicos

Agrupamento Reconhecimento de

Objetos, Cenas e Eventos

Entrada Sensorial

Semântica

Análise

Bidimensional Bordas

Retas

Aparentes

Busca e agrupamento de

características nas

imagens normalizadas

Resultado pode ser

repassado para etapa posterior

ou utilizado no refino da

etapa anterior

Imagem Normalizada

Hierarquia de um Sistema Geral de

Visão Computacional

TCC-00.169 Introdução à Ciência da Computação (2012.2) 14

Percepção

Normalização Análise

Bidimensional

Agrupamento Reconhecimento de

Objetos, Cenas e Eventos

Entrada Sensorial

Semântica

Recuperação de

Parâmetros Físicos

Exemplos de parâmetros

físicos:

- Orientação da superfície

- Forma 2-D de objetos

- Movimento aparente

- Direção da iluminação

- Etc.

Imagens

Normalizadas

Características

Bidimensionais

Profundidade

Estimada

Movimentação

Aparente das

Câmeras

Hierarquia de um Sistema Geral de

Visão Computacional

TCC-00.169 Introdução à Ciência da Computação (2012.2) 15

Percepção

Normalização Análise

Bidimensional

Recuperação de

Parâmetros Físicos

Reconhecimento de

Objetos, Cenas e Eventos

Entrada Sensorial

Semântica

Agrupamento

Etapa que agrega partes

significativas dos dados

Pode ocorrer associação

de características similares

vindas de fontes diferentes

Regiões com pixels claros

- Regulares

- Irregulares

Regiões com pixel escuros

- Regulares

- Irregulares

Hierarquia de um Sistema Geral de

Visão Computacional

TCC-00.169 Introdução à Ciência da Computação (2012.2) 16

Percepção

Normalização Análise

Bidimensional

Recuperação de

Parâmetros Físicos

Agrupamento Reconhecimento de

Objetos, Cenas e Eventos

Entrada Sensorial

Semântica

Regiões com pixels claros

- Regulares: casas brancas

- Irregulares: peças brancas

Regiões com pixel escuros

- Regulares: casas pretas

- Irregulares: peças pretas

Interpretação da situação

Inferência

É feita correspondência

entre estruturas relacionais

abstratas conhecidas

e dados agrupados

Detecção de Retas em Imagens

Exemplo Prático

TCC-00.169 Introdução à Ciência da Computação (2012.2) 17

Você consegue ver retas na imagem?

TCC-00.169 Introdução à Ciência da Computação (2012.2) 18

Aplicação Prática

Antes de Começar

• Escolher como representar as entradas

Pontos

• Escolher como representar as saídas

Retas

• Entender o problema, buscar uma solução e

convertê-la em etapas

• Verificar necessidade de pré-processamento

TCC-00.169 Introdução à Ciência da Computação (2012.2) 19

Pontos de Entrada Representação

TCC-00.169 Introdução à Ciência da Computação (2012.2) 20

Espaço de Imagem

x

y

p

p = (x, y)

Coordenadas cartesianas

do ponto

Retas Detectadas Representação

TCC-00.169 Introdução à Ciência da Computação (2012.2) 21

Espaço de Imagem

x

y

r

θ ρ

ρ = x cos θ + y sin θ

Equação Normal

da Reta

Solução Força-Bruta

• Cada par de pontos define uma reta

• Solução

Tomar pontos dois a dois

Anotar todas as retas possíveis

Contar quantas vezes cada reta repete

Retornar retas mais frequentes

TCC-00.169 Introdução à Ciência da Computação (2012.2) 22

Não vale a pena!

Muito esforço

computacional

Transformada de Hough

TCC-00.169 Introdução à Ciência da Computação (2012.2) 23

x

y

r

p

q s

Espaço de Imagem Espaço de Parâmetros

ρ = x cos θ + y sin θ

θ

r’

s’

p’

q’

ρ

Transformada de Hough

TCC-00.169 Introdução à Ciência da Computação (2012.2) 24

Espaço de Imagem Espaço de Parâmetros

Pré-Processamento

TCC-00.169 Introdução à Ciência da Computação (2012.2) 25

Converter imagens coloridas para

imagens de borda

Visão Computacional em

Ciência da Computação

TCC-00.169 Introdução à Ciência da Computação (2012.2) 26

Subáreas de Computação Visual

• Animação

• Computação gráfica

• Modelagem

• Processamento de imagens

• Vídeo digital

• Visão computacional

• Visualização

TCC-00.169 Introdução à Ciência da Computação (2012.2) 27

TCC-00.169 Introdução à Ciência da Computação (2012.2)

Campos Relacionados

28

Sistema

de Visão

Processamento

de Imagens

Aprendizado

de Máquina

Inteligência

Artificial

Matemática

Neurobiologia

Imagiologia

Física

Processamento

de Sinais

Robótica

Visão robótica

PS não linear

PS multivariável

Óptica

Smart cameras

Visão biológica

Estatística

Geometria

Otimização

Visão cognitiva

Inteligência

computacional

Visão

Computacional

Considerações Finais

TCC-00.169 Introdução à Ciência da Computação (2012.2) 29

Considerações Finais

• Um sistema de visão computacional

agrega diversas técnicas

• Dados brutos precisam ser

lapidados para uso

• Esforço maior está em inserir inteligência

em sistemas computacionais

• Adota modelos vindos de diferentes áreas

do conhecimento

TCC-00.169 Introdução à Ciência da Computação (2012.2) 30

Presente e Futuro

• É preciso avançar o estado da arte

Área “imatura” (no bom sentido)

• Espaço para novas ideias

Técnicas atuais são moldadas para

(sub)casos específicos

• Perspectiva de mercado

Grandes empresas estão contratando

TCC-00.169 Introdução à Ciência da Computação (2012.2) 31

Professores no IC-UFF

• Anselmo Montenegro

• Aura Conci

• Cristina Nader Vasconcelos

• Helena Cristina da Gama Leitão

• José Ricardo de Almeida Torreão

• Leandro Augusto Frata Fernandes

TCC-00.169 Introdução à Ciência da Computação (2012.2) 32

Obrigado!

TCC-00.169 Introdução à Ciência da Computação (2012.2) 33