16
Diferentes técnicas para a detecção de peões em vídeo

Apresentação PDI - 15/11/2012

Embed Size (px)

DESCRIPTION

Apresentão PDI - 15/11/2012

Citation preview

Diferentes técnicas para a detecção de peões em vídeo

Introdução

● Procuramos investigar soluções e técnicas para a detecção de peões;

● Podemos usar estas técnicas para vídeo vigilância, robótica e tracking de jogadores de jogos de equipa;

● Difícil de fazer devido a questões de aparência, luminosidade e articulações;

1. Sistemas existentes

● 2 tipos de métodos:– Detecção por partes;– Detecção do corpo inteiro;

1.1. Detecção partes

● Rosto é uma característica que se destinge facilmente;

● Reconhecimento de faces encontra-se em fase avançada;

● Problemas: imagem nem sempre esta visível;● Algoritmos: Viola e Jonas (derivados do

método de Haar);

● Detecta diferentes partes do corpo;– Cabeça;– Braços;– Pernas;

● Analisa depois tamanho e distancia relativa gerando um resultado;

1.2. Detecção corpo inteiro

● Papgeorgiou e Poggio usaram representações baseadas em Haar juntamente com o polinómio SVM;

● Algoritmos: Gavrila e Philomin (comparação de contornos);

● Dalal e Triggs usaram uma densa representação de Histogramas Orientados a Gradientes (HoG) para obter sucesso na representação dos objetos;

1.4. Comparação entre algoritmos

Algoritmo Conjunto de

Recursos

Aplicação Taxa de retenção (falsos

positivos)

Taxa de Frames

Tamanho de janela

Tamanho de

Imagem

Gravrila Modelos de formas

e transformação de

distâncias

Reconhecimento de peões por

carros

87% (3.58 por

imagem)

7-15 fps (P4-2.5G

Hz)

140 pixéis altura (max)

N/A

Viola Características de ar e padrões

de moviment

o

Vigilância de ruas

80% (0,5 por

imagem)

4 fps (P4-2.8G

Hz)

20 x 15 pixels

N/A

Zhu Histograma de

gradientes orientados

(HoG)

Detecção de peões em geral

88% (1,25 por

imagem)

18 fps (N/A)

64 x 128 pixels

320 x 240

1.4. Comparação entre algoritmos

Algoritmo Conjunto de

Recursos

Aplicação Taxa de retenção (falsos

positivos)

Taxa de Frames

Tamanho de janela

Tamanho de

Imagem

Mohan Detenção de

componentes e

relação de distâncias

Detecção de peões em geral

85% (6 x 10-4

FRPW)

N/A 64 x 128 pixels

N/A

Zhang Combinação de

contornos e HoG

Vigilância de ruas

80% (2,5 por

imagem)

N/A 24 x 58 pixels

N/A

Alonso Combina diferentes características como

os contornos

HoG e Haar

Reconhecimento de peões por

carros

85% (0,008 FFPW)

20 fps (P4-2.4G

Hz)

N/A 320 x 240

1.5. Análise comparação algoritmos

● Técnicas baseadas em HoG são mais eficazes;

● Técnica que analisaremos;

2. Técnicas baseadas em HoG

2.1. Algoritmo Dalal-Triggs

● Cada janela de detecção é dividida em células de 8x8 px;

● Cada grupo de células 2 x 2 é de forma deslizante integrado num único bloco;

● Blocos ficam sobrepostos;

● Cada célula consiste numa matriz de 9 canais que armazenam o Histograma Orientado a Gradientes;

● Cada bloco contem um vector concatenado de todas as suas células;

● Cada célula é representada por um vector de 36 características normalizado;

● Cada janela de detecção de tamanho 64 x 128 é representada sobre a forma de 7 x 15 blocos dando um total de 3780 características por janela;

2.2. Algoritmo de Zhu

● Baseado no anterior;

● Foram integrados classificadores estruturais em cascata;

● Estas alterações permitem aumentar a velocidade de processamento da detecção de formas humanas e manter uma boa performance;

2.3. Vídeo Exemplo

http://www.youtube.com/watch?v=PyNGX74IPV8

3. Desafios de implementação

● Principal desafio para a implementação deste tipo de algoritmos:– recorrer à câmara do nosso computador, a taxa de

detecção dos algoritmos rondar os 20 frames por segundo, o que é muito baixo para os efeitos pretendidos;

● Melhoria do processo: tornar os algoritmos mais rápidos e mais leves para o computador.

4. Outras técnicas utilizadas

● Métodos anteriormente implementados utilizando uma simples câmara;

● Durante a pesquisa foram analisadas outras técnicas que não foram abordadas devido a não se poder aceder a todo o material necessário:– Câmaras de infravermelho;– Câmaras stereo.

● Detecção de passadeiras;