32
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR) Introdução + Estudo de Caso

Aprendizagem de Máquina - eletrica.ufpr.brEstudodeCaso-AM.pdf · – Reconhecimento da fala – Identificação de impressões digitais – OCR (Reconhecimento ótico de caracteres)

Embed Size (px)

Citation preview

Aprendizagem de Máquina

Alessandro L. Koerich

Programa de Pós-Graduação em Engenharia ElétricaUniversidade Federal do Paraná (UFPR)

Introdução + Estudo de Caso

Introdução

• Percepção de máquina• Um exemplo• Um sistema inteligente• O ciclo de projeto• Aprendizagem e adaptação• Conclusão

Percepção de Máquina

• Construir uma máquina que possa padrões:

– Reconhecimento da fala

– Identificação de impressões digitais

– OCR (Reconhecimento ótico de caracteres)

– Identificação da seqüência de DNA

Um Exemplo

• “Separar peixes vindo em uma esteira de acordo com a espécie usando um sensor ótico”

Robalo

Espécies

Salmão

Robalo x Salmão

Robalo

Robalo x Salmão

Salmão

Análise de Problema

• Montar uma câmera e colher algumas imagens de exemplo para extrair características.

• Quais características?– Comprimento– Luminosidade– Largura– Número e forma das nadadeiras– Posição da boca, etc…

• Este é um conjunto de todas características sugeridas a serem exploradas em nosso classificador!

Pré-Processamento

• Usa uma operação de segmentação para isolar os peixes uns dos outros e do fundo.

• A informação de um único peixe é enviada para um extrator de características cujo propósito é reduzir os dados através da medida de certas características.

• As características são passadas a um classificador

Visão Geral

Características

• Selecionar o comprimento do peixe como uma característica possível para discriminação.

Características

Características

• O comprimento é uma característica fraca isoladamente!

• Selecionar a luminosidade como uma característica possível.

Características

Classificação

• Relação entre o limiar da fronteira de decisão e custo

– Mover nossa fronteira de decisão em direção a valores menores de luminosidade no intuito de minimizar o custo (reduzir o número de robalos que são classificados como salmão)

Tarefa da teoria da decisão

Características

• Adotar a luminosidade e adicionar a largura do peixe

• Peixe xT = [x1, x2]

Luminosidade Largura

Fronteira de Decisão

Características

• Poderíamos adicionar outras características que não sejam correlacionadas com as que já temos. Devemos ter precaução para não reduzir o desempenho pela adição de “características ruidosas”

• Idealmente, a melhor fronteira de decisão deve ser aquela que fornece um desempenho ótimo como na seguinte figura:

Fronteira de Decisão

Fronteira de Decisão

• Entretanto, nossa satisfação é prematura, pois, o objetivo principal no projeto de um classificador é classificar corretamente novas entradas

Papel da generalização!

Fronteira de Decisão

Sistemas Inteligentes

• Aquisição

– Uso de um transdutor (câmera ou microfone)– Sistemas de RP dependem da largura de banda,

resolução, sensibilidade e distorção do transdutor

• Segmentação e agrupamento

– Padrões devem ser bem separados e não devem se sobrepor

Sistemas Inteligentes

• Extração de características– Características discriminantes– Características invariantes com respeito a translação,

rotação e escala.

• Classificação– Usa um vetor de características fornecido pelo extrator de

características para atribuir o objeto a uma categoria.

• Pós-Processamento– Explora informação dependente do contexto (não inerente

do próprio padrão) para melhorar o desempenho.

O Ciclo de Projeto

• Obtenção de dados• Escolha de características• Escolha do modelo• Treinamento (aprendizagem)• Avaliação• Complexidade computacional

O Ciclo de Projeto

• Obtenção de dados

– Como sabemos quando já coletamos uma quantidade suficientemente grande e representativa de exemplos para treinamento e teste do sistema?

O Ciclo de Projeto

• Escolha de características

– Depende das características do domínio de aplicação. Simples de extrair, invariantes a transformações irrelevantes, insensível a ruído.

O Ciclo de Projeto

• Escolha do modelo

– Insatisfeito com o desempenho do nosso classificador de peixes e querendo mudar para outra classe de modelo.

O Ciclo de Projeto

• Treinamento

– Usar dados para determinar o classificador.– Inúmeros procedimentos para o treinamento de

classificadores e escolha de modelos.

O Ciclo de Projeto

• Avaliação

– Medir a taxa de erro (ou desempenho) e mudar de um conjunto de características para outro.

– Alterar o classificador

O Ciclo de Projeto

• Complexidade computacional

– Qual é o compromisso entre facilidade computacional e desempenho?

– Como o algoritmo se comporta em função do número de características, padrões ou categorias?

Conclusão

• Reconhecimento de padrões envolve inúmeros subproblemas que pode ter magnitude e complexidade variáveis

• Muitos destes sub-problemas podem contudo serem resolvidos

• Diversos problemas continuam sem solução