65
Prof. Dr. Anderson Rocha [email protected] http://www.ic.unicamp.br/~rocha Reasoning for Complex Data (RECOD) Lab. Institute of Computing, Unicamp Av. Albert Einstein, 1251 - Cidade Universitária CEP 13083-970 • Campinas/SP - Brasil Análise Forense de Documentos Digitais

Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Prof. Dr. Anderson [email protected]

http://www.ic.unicamp.br/~rocha

Reasoning for Complex Data (RECOD) Lab.Institute of Computing, Unicamp

Av. Albert Einstein, 1251 - Cidade UniversitáriaCEP 13083-970 • Campinas/SP - Brasil

Análise Forense deDocumentos Digitais

Page 2: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Organização

Page 3: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Avisos

‣ Aulas

• 31/08 – Não haverá aula

• 02/09 – Detecção de Pornografia em I&VDr. Eduardo Valle

• 09/09 – Detecção de Duplicações em I&VProf. Eduardo Valle

3

Page 4: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Avisos

‣ Matlab R14 instalado nos LABs do IC-3 (Linux e Windows)

‣ Site da disciplina

4

http://www.ic.unicamp.br/~rocha/teaching/2010s2/mo815/index.html

Page 5: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Organização

‣ Conceitos de Imagem Digital

‣ Operações com Imagens

‣ Aprendizado de Máquina

5

Page 6: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Organização

‣ Aprendizado de Máquina

• Supervisionado

• Não-Supervisionado

• Semi-Supervisionado

‣ Avaliação e Comparação de Métodos

6

Page 7: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Imagem

Page 8: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

‣ De acordo com [Gomes & Velho 1996], para trabalharmos com imagens, devemos estabelecer um universo matemático no qual seja possível definir diversos modelos abstratos destas

‣ Em seguida, precisamos criar um universo de representação onde procuramos esquemas que permitam uma representação discreta desses modelos

8

Page 9: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

‣ O objetivo da representação discreta desses modelos é codificar a imagem no computador

‣ Quando observamos uma fotografia, ou uma cena no mundo real, recebemos de cada ponto do espaço um impulso luminoso que associa uma informação de cor a esse ponto

9

Page 10: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

‣ Nesse sentido, podemos definir uma imagem contínua (não discreta) como a aplicação

onde é uma superfície e é um espaço vetorial

‣ Na maioria das aplicações, é um subconjunto plano e é um espaço de cor

10

I : U → C

U ⊂ R3 C

UC

Page 11: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

‣ A função na definição é chamada de função imagem

‣ O conjunto é chamado suporte da imagem

‣ O conjunto de valores de , que é um subconjunto de , é chamado de conjunto de valores da imagem

11

I

U

IC

Page 12: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

‣ Quando é um espaço de cor de dimensão 1, dizemos que a imagem é monocromática ou em tons de cinza

‣ A representação mais comum de uma imagem espacial consiste em tomar um subconjunto discreto do domínio da imagem, uma espaço de cor associado a um dispositivo gráfico e representar a imagem pela amostragem da função imagem

12

C

U � ⊂ UC

I → U �

Page 13: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

‣ Cada ponto do subconjunto discreto é chamado de elemento da imagem ou pixel

‣ Para a representação em computador, devemos também trabalhar com modelos onde a função imagem toma valores em um subconjunto discreto do espaço de cor

‣ Esse processo de discretização é chamado de quantização

13

(xi, yi) U �

IC

Page 14: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

‣ O caso mais utilizado de discretização espacial de uma imagem consiste em tomar o domínio como sendo um retângulo e discretizar esse retângulo usando os pontos de um reticulado bidimensional

‣ Dessa forma a imagem pode ser representada de forma matricial por uma matriz

14

A(m×n) = (aij = (I(xi, yj))

Page 15: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

‣ Cada elemento e da matriz representa o valor da função imagem no ponto de coordenadas do reticulado

‣ Dessa forma, cada ponto é um vetor do espaço de cor representando a cor do pixel na coordenada da imagem

15

aij , i = 1, . . . ,m j = 1, . . . n

I (xi, yj)

aij

(i, j)

Page 16: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

‣ Se cada ponto possui três valores associados e cada valor precisa de oito bits para ser representado, então cada pixel dessa imagem pode ser representado com 24 bits

‣ A imagem é dita de 24 bits

‣ Se cada pixel também codifica transparência, a imagem tem um quarto canal, chamado alfa, tornando-se uma imagem de 32 bits

16

Page 17: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

17

136 6 Digital Images

Fig. 6.1. Abstraction levels in the representation of an image.

Note that these levels will be realized concretely in di!erent ways in animage processing system. For this reason, in order to obtain a unified schemefor image processing, we must use transformations to pass from one level toanother, and we must also be able to manipulate descriptions on a single level(see Chapter 2).

6.2 The Spatial Model

Although there are several mathematical models appropriate for the descrip-tion of images, we will stress in this book the so-called spatial model, whichis the one best suited for computer graphics applications.

6.2.1 Continuous Images

When we look at a photograph or a real-life scene, we receive from each pointin space a light impulse, which associates color information to that point.

136 6 Digital Images

Fig. 6.1. Abstraction levels in the representation of an image.

Note that these levels will be realized concretely in di!erent ways in animage processing system. For this reason, in order to obtain a unified schemefor image processing, we must use transformations to pass from one level toanother, and we must also be able to manipulate descriptions on a single level(see Chapter 2).

6.2 The Spatial Model

Although there are several mathematical models appropriate for the descrip-tion of images, we will stress in this book the so-called spatial model, whichis the one best suited for computer graphics applications.

6.2.1 Continuous Images

When we look at a photograph or a real-life scene, we receive from each pointin space a light impulse, which associates color information to that point.

136 6 Digital Images

Fig. 6.1. Abstraction levels in the representation of an image.

Note that these levels will be realized concretely in di!erent ways in animage processing system. For this reason, in order to obtain a unified schemefor image processing, we must use transformations to pass from one level toanother, and we must also be able to manipulate descriptions on a single level(see Chapter 2).

6.2 The Spatial Model

Although there are several mathematical models appropriate for the descrip-tion of images, we will stress in this book the so-called spatial model, whichis the one best suited for computer graphics applications.

6.2.1 Continuous Images

When we look at a photograph or a real-life scene, we receive from each pointin space a light impulse, which associates color information to that point.

RepresentaçãoContínua

RepresentaçãoDiscreta

RepresentaçãoSimbólica

amostragem

codificação

decodificação

reconstrução

© G

omes

& V

elho

Page 18: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Espaços de Cor

‣ O espaço de cor pode variar de acordo com o dispositivo de exibição (e.g., monitor, impressora)

‣ Espaços de cor

• RGB (Vermelho, Verde, Azul)

• CMYK (Ciano, Magenta, Amarelo, Preto)

• HSV (Matiz, Saturação e Brilho)

• etc.

18

Page 19: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Espaço de cor RGB

‣ O propósito principal do sistema RGB é a reprodução de cores em dispositivos eletrônicos

• monitores de TV e computador

• datashows

• scanners

• câmeras digitais

• fotografia tradicional

19

© W

ikip

edia

.org

Page 20: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

20©

A. R

ocha

Page 21: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Imagem

21

© A

. Roc

ha (

Mon

tage

m)

* The Persistence of Memory by Salvador Dali

Page 22: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Espaço de cor CMYK

‣ Modelo de cores subtrativas

‣ Contraposição ao RGB

‣ Apropriado para impressoras

‣ K vem de keyed (alinhamento) da placa de impressão de cor preta com as outras

22

© W

ikip

edia

.org

© Wikipedia.org

Page 23: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Espaço de cor HSV

‣ Matiz (tonalidade): verifica o tipo da cor (abrange todas as cores do espectro)

‣ Saturação (pureza): valores baixos são próximos do cinza. Valores altos são próximos da cor pura

‣ Brilho: define o brilho (intensidade) da cor

23

© W

ikip

edia

.org

Page 24: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Operações comImagens

Page 25: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Quantização

‣ Mapeamento dos números reais em valores discretos

‣ Tipicamente utiliza-se bytes (256 valores) ou inteiros curtos (65536 valores)

25

Page 26: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Warping

26

‣ Modifica o “domínio” da função de imagem.

Page 27: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Transformações - Atributos

27

blur

arestas

canal

Page 28: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Decomposição em Canais de Cores

‣ Quando separamos a imagem em suas cores básicas representadas no espaço de cores

‣ Se o espaço de cores utilizado é um espaço RGB, temos os componentes vermelho (Red), verde (Green), e azul (Blue);

28

C� ∈ C

Page 29: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Decomposição Wavelet

29

D1

D3

D2

L

V1

H1

H2

V2

V3

H3

© A. Rocha

© A. Rocha

Page 30: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Decomposição em Planos de Bits‣ Quando decompomos a imagem em seus planos

de bits

‣ Por exemplo, após a decomposição da imagem de 24 bits em seus três canais de cores (R,G,B), podemos ainda, fazer uma decomposição por planos de bits.

‣ Cada canal de cor possui 8 bits e possui 8 planos de bits por canal de cor

30

Page 31: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais 31

* Decomposição da imagem em canais de bits

© A

. Roc

ha

Decomposição em Planos de Bits

Page 32: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Nomenclaturas

Page 33: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Nomenclatura

‣ Diferentes áreas tem nomes distintos para coisas parecidas

• Aprendizado de Máquina

• Reconhecimento de Padrões

• Aprendizado Estatístico

• Mineração de Dados

33

Page 34: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Aprendizado deMáquina

Page 35: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Aprendizado de Máquina

‣ Aprendizado de Máquina é uma área da Inteligência Artificial concentrada no desenvolvimento de técnicas que permitem que computadores sejam capazes de aprender com a experiência [Mitchell 1997]

‣ Extração de informações e extrapolação do conhecimento a partir de dados

35

Page 36: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Aprendizado de Máquina

‣ Alguns problemas que utilizam aprendizado de Máquina [Mitchell 1997] [Friedman et al. 2001]

• reconhecimento de caracteres

• reconhecimento da fala

• predição de ataques cardíacos

• detecção de fraudes em cartões de créditos

36

Page 37: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Aprendizado de Máquina

‣ Na solução desses problemas, podemos ter classificadores fixos ou baseados em aprendizado, que, por sua vez, pode ser supervisionado ou não-supervisionado [Friedman et al. 2001]

37

Page 38: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

‣ Podemos ver um classificador, matematicamente, como um mapeamento a partir de um espaço de características X para um conjunto discreto de rótulos (labels) Y

‣ Em IA, um classificador de padrões é um tipo de motor de inferência que implementa estratégias eficientes para computar relações de classificação entre pares de conceitos ou para computar relações entre um conceito e um conjunto de instâncias [Duda et al. 2000]

38

Definição – Classificadores

Page 39: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Classificadores

‣ Classificadores podem ser

• Supervisionados

• Semi-Supervisionados

• Não-Supervisionados

39

Page 40: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Classificadores

‣ Classificadores supervisionados consistem em técnicas em que procuramos estimar uma função de classificação a partir de um conjunto de treinamento

‣ O conjunto de treinamento consiste de pares de valores de entrada X, e sua saída desejada Y [Friedman et al. 2001]

40

f

Page 41: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Classificadores

‣ Valores observados no conjunto X são denotados por , isto é, é a i-ésima observação em X

‣ O número de variáveis que constituem cada uma das entradas em em X é p

‣ Assim, X tem n observações, chamados de vetores de características

41

xi xi

Page 42: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Classificadores

‣ Cada vetor de entrada é composto por p graus de liberdade (dimensões ou variáveis)

‣ A saída da função pode ser um valor contínuo (regressão) ou pode predizer a etiqueta (label) de um objeto de entrada (classificação)

42

f

Page 43: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Classificadores

‣ A tarefa do aprendizado é predizer o valor da função para qualquer objeto de entrada que seja válido após ter sido suficientemente treinado com um conjunto de exemplos [Bishop 2006]

‣ Alguns exemplos de classificadores supervisionados são

• Support Vector Machines

• Linear Discriminant Analysis,

• Boosting

43

Page 44: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

‣ Um outro grupo de técnicas de aprendizado, não utilizam exemplos de treinamento marcados (classe conhecida)

‣ Conhecidos como técnicas para aprendizado não-supervisionado

‣ Esta forma de aprendizado, na maioria das vezes, trata o seu conjunto de entrada como um conjunto de variáveis aleatórias

44

Aprendizado Não-Supervisionado

Page 45: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Aprendizado Não-Supervisionado

‣ Um modelo de distribuição conjunta (joint distribution model) é então construído para a representação dos dados

‣ Desta forma, o objetivo deste aprendizado é avaliar como os dados estão organizados e agrupados [Friedman et al. 2001]

‣ Técnicas de Maximização de Esperança [Baeza-Yates 2003], por exemplo, podem ser utilizadas para aprendizado não-supervisionado

45

Page 46: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Aprendizado Semi-Supervisionado

‣ Um outro grupo de técnicas de aprendizado envolve abordagens mistas

• Supervisionado

• Não Supervisionado

‣ São as técnicas Semi-Supervisionadas

46

Page 47: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Modelagem deProblemas

Page 48: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Modelagem de Problemas

‣ Problemas são descritos por variáveis

‣ Dois tipos

• Reais

• Categóricas

48

Page 49: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Modelagem de Problemas

‣ Como transitar entre os dois tipos de variáveis?

‣ É possível “converter” uma representação em outra?

49

Page 50: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Modelagem de Problemas

‣ Simplicidade vs. Complexidade

‣ O que é realmente importante?

‣ Precisamos realmente de todos os dados possíveis para tomar uma decisão?

50

Page 51: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Modelagem de Problemas

‣ Dimensão do vetor de características tem efeitos colaterais importantes:

‣ Dimensão alta

• Distâncias médias ficam grandes

• Dados ficam esparsos

‣ Maldição da Dimensionalidade

51

Page 52: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Aprendizado Supervisionado

(Primeiros Passos)

Page 53: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Aprendizado Supervisionado

‣ Dados para Aprendizado Supervisionado

‣ “Give me more data”

‣ Classificação vs. Regressão

53

Page 54: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Aprendizado Supervisionado

‣ Será que quanto mais complexo nosso modelo de “predição” melhor o resultado?

54

Page 55: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Exemplo – KNN

‣ K-Vizinhos mais Próximos (KNN)

‣ Um exemplo de técnica baseada em instâncias.

‣ Não há “aprendizado”

• decisões são feitas para cada instância

55

Page 56: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais

KNN –

Elements of Statistical Learning c!Hastie, Tibshirani & Friedman 2001 Chapter 2

1-Nearest Neighbor Classifier

.. .. .. . . . . .. . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . .. . . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . . .. . . . . . . . .

oo

ooo

o

o

o

o

o

o

o

o

oo

o

o o

oo

o

o

o

o

o

o

o

o

o

o

o

o

oo

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

oo

oo

o

o

o

o

o

o

o

o

o

oo o

oo

oo

o

oo

o

o

o

oo

o

o

o

o

o

o

o

o

o

o

o

o

oo

o

o

ooo

o

o

o

o

o

oo

o

o

o

o

o

o

o

oo

o

o

o

o

o

o

o

o oooo

o

ooo o

o

o

o

o

o

o

o

ooo

ooo

ooo

o

o

ooo

o

o

o

o

o

o

o

o o

o

o

o

o

o

o

oo

ooo

o

o

o

o

o

o

ooo

oo oo

o

o

o

o

o

o

o

o

o

o

Figure 2.3: The same classification example in two

dimensions as in Figure 2.1. The classes are coded

as a binary variable (GREEN = 0, RED = 1), and then

predicted by 1-nearest-neighbor classification.

56

© J.

Fri

edm

an e

t al

.

k = 1

Page 57: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais

KNN –

57

© J.

Fri

edm

an e

t al

.

Elements of Statistical Learning c!Hastie, Tibshirani & Friedman 2001 Chapter 2

15-Nearest Neighbor Classifier

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .

..

. .. .. .. .. . .. . .. . .. . . . .. . . . . .. . . . . . .. . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

oo

ooo

o

o

o

o

o

o

o

o

oo

o

o o

oo

o

o

o

o

o

o

o

o

o

o

o

o

oo

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

o

oo

oo

o

o

o

o

o

o

o

o

o

oo o

oo

oo

o

oo

o

o

o

oo

o

o

o

o

o

o

o

o

o

o

o

o

oo

o

o

ooo

o

o

o

o

o

oo

o

o

o

o

o

o

o

oo

o

o

o

o

o

o

o

o oooo

o

ooo o

o

o

o

o

o

o

o

ooo

ooo

ooo

o

o

ooo

o

o

o

o

o

o

o

o o

o

o

o

o

o

o

oo

ooo

o

o

o

o

o

o

ooo

oo oo

o

o

o

o

o

o

o

o

o

o

Figure 2.2: The same classification example in two

dimensions as in Figure 2.1. The classes are coded as a

binary variable (GREEN = 0, RED = 1) and then fit by 15-

nearest-neighbor averaging as in (2.8). The predicted

class is hence chosen by majority vote amongst the 15-

nearest neighbors.

k = 15

Page 58: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Avaliação eComparação

Page 59: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais

Avaliação e Comparação

‣ Viés e Variância

‣ Treinamento e Teste

‣ Matriz de Confusão

‣ Métricas e Critérios

59

Page 60: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais

Avaliação e Comparação

‣ Conjuntos de validação e teste

‣ Validação cruzada

60

Page 61: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais

Curvas ROC

61

‣ Especificidade

• E = TN / (TN + FP)

‣ Sensitividade

• S = TP / (TP + FN)

‣ (Sensitividade) vs. (1 - Especificidade) = Curva Característica de Operação (ROC)

Page 62: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Rocha & Goldenstein, 2010 – CSI: Análise Forense de Documentos Digitais

Curvas ROC

62

© W

ikip

edia

.org

Page 63: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Referências

Page 64: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

A. Rocha, 2010 – Análise Forense de Documentos Digitais

Referências

1. [Baeza-Yates 2003] R. Baeza-Yates. Clustering and Information Retrieval. Kluwer Academic Publishers. 1 edition.

2. [Bishop, 2006] C. M. Bishop. Pattern Recognition and Machine Learning. Springer, 1 edition, 2006.

3. [Duda et al. 2001] R. O. Duda, P. E. HART and D. G. STORK. Pattern Classification. Wiley-Interscience, 2, 2000.

4. [Friedman et al. 2001] J. Friedman, T. Hastie, and R. Tibshirani. The Elements of Statistical Learning. Springer, 1 edition, 2001.

5. [Gomes & Velho, 1996] J. Gomes L. Velho. Computação Gráfica: Imagem. IMPA-SBM, 1.

6. [Gonzalez & Woods, 2007] R. Gonzalez and R. Woods. Digital Image Processing. Prentice-Hall, 3 edition.

7. [Mitchell 1997] T. M. Mitchell. Machine Learning. McGraw-Hill, 1 edition, 1997.

64

Page 65: Análise Forense de Documentos Digitaisrocha/teaching/2010s2/mo815/aulas/aul… · A. Rocha, 2010 – Análise Forense de Documentos Digitais Imagem ‣Se cada ponto possui três

Obrigado!