110
UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê) Comitês de Máquinas: Prof. Dr. André A. P. Biscaro 2º Semestre de 2017 Ensembles e Misturas de Especialistas

Comitês de Máquinas

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Comitês de

Máquinas:

Prof. Dr. André A. P. Biscaro

2º Semestre de 2017

Ensembles e Misturas de

Especialistas

Page 2: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Estrutra da Apresentação Definições e Motivação;

Ensembles:

Aspectos Gerais;

A Questão da Diversidade;

Etapas de Construção:

Seleção de Componentes;

Combinação de Componentes;

Treinamento e inserção de diversidade;

Mistura de Especialistas;

Referências Bibliográficas

2

Page 3: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Definições

&

Motivação

3

Page 4: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

O objetivo principal por trás da formação desses comitês está em reunir

pessoas que tenham um certo domínio do assunto em questão, mas que, ao

mesmo tempo, tenham opiniões diversas.

Isso permite levantar discussões que

contribuam para:

A identificação dos principais pontos positivos e

negativos que possam estar associados a cada

uma das opções de decisão;

A escolha da melhor solução para o problema

em questão.

4

Definições e Motivação

Page 5: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

No campo da inteligência computacional, mais especificamente em

aprendizado de máquina, a ideia de formação de comitês de indivíduos que

tenham um bom conhecimento sobre um problema e ao mesmo tempo

tenham “opiniões”, em certo grau, distintas dos demais indivíduos no

comitê foi adotada nos chamados:

Comitês de Máquinas

5

Definições e Motivação

Page 6: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Método de aprendizado (supervisionado ou não-

supervisionado) cujo objetivo é aumentar a capacidade de

generalização de estimadores.

(aproximadores de função/regressores, classificadores, etc.)

Comitê de Máquinas

6

Definições e Motivação

Page 7: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Tipos de Comitês de Máquinas

Estrutura estática: Ensembles

Combinador

7

Definições e Motivação

Page 8: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Tipos de Comitês de Máquinas

Estrutura dinâmica: Mistura de Especialistas (ME)

Seletor sem graduação

8

Definições e Motivação

Page 9: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Tipos de Comitês de Máquinas

Estrutura dinâmica: Mistura de Especialistas (ME)

Seletor com graduação

9

Definições e Motivação

Page 10: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Erro de generalização

10

Espaço de

Hipótese

Espaço

Objetivo

Erro de

Estimação

Erro de

Aproximação Erro de

Generalização

)(0 xf

)(ˆ, xf Nn

Processo de aproximação -

Técnica de Seleção do

modelo

Escolha do

espaço de

modelo,

discordância do

modelo

s

Figuras

extraídas de

Lima (2004)

Definições e Motivação

Page 11: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Três formas de se reduzir o erro de generalização

11

H

f

3h 2h

1h

4h

H

f

3h 2h

1h

4h

H

f

3h

2h

1h

4h

Estatística Computacional

Representacional

Figuras

extraídas de

Lima (2004)

Definições e Motivação

Page 12: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Exemplo: Aproximação de Funções

Ensembles:

Combinação por

Média Simples

12

Definições e Motivação

Page 13: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Exemplo: Predição de Séries Temporais

Combinação por Média

Simples

13

Comitê

Máquin

a1

Máquin

a2

Máquin

a3

Série original

Aproximação

Problema de Predição

Figuras extraídas de

Puma-Villanueva (2006)

Definições e Motivação

Page 14: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Exemplo: Classificação de Padrões

Ensembles:

Combinação por

Voto Majoritário

14

Definições e Motivação

Page 15: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Exemplo: Classificação de Padrões

Mistura de

Especialistas:

* ME também podem ser aplicadas

a problemas de regressão.

15

Definições e Motivação

Page 16: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Exemplo: Agrupamento de Dados (Clusterização)

Ensembles:

Combinação por

Voto Majoritário

16

1

23

4

5

7

6

8

9

1

23

4

5

7

6

8

9

1

23

4

5

7

6

8

9

Agrupador 1 Agrupador 3Agrupador 2

1

23

4

5

7

6

8

9

1

23

4

5

7

6

8

9

Combinação resultante

Figuras extraídas de

Puma-Villanueva (2006)

Definições e Motivação

Page 17: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Ensembles:

Aspectos Gerais

17

Page 18: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Ensembles

Ensemble é um paradigma de aprendizado em que propostas alternativas de

solução para um problema, denominadas componentes, têm suas saídas

individuais combinadas na obtenção de uma solução final.

Em um ensemble, os M componentes recebem os mesmos dados de

entrada e geram resultados individuais, que são combinados (∑) em uma

única saída.

18

Page 19: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Intuitivamente, a combinação de múltiplos componentes é vantajosa, uma

vez que componentes diferentes podem implicitamente representar

aspectos distintos e, ao mesmo tempo, relevantes para a solução de um

dado problema.

A abordagem de ensembles tem sido amplamente utilizada nas últimas duas

décadas, tanto para problemas de regressão quanto para problemas de

classificação de padrões, já que os ensembles são comprovadamente

capazes de aumentar a capacidade de generalização e, consequentemente, o

desempenho geral do sistema (Hansen & Salamon, 1990; Hashem et al., 1994).

19

Ensembles

Page 20: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

No entanto, tal melhora na capacidade de generalização se apoia na

qualidade de seus componentes e na diversidade do erro apresentada por

eles (Perrone & Cooper, 1993):

Cada um dos componentes em um ensemble deve apresentar um bom

desempenho quando aplicado isoladamente ao problema e, ao mesmo tempo,

deve “cometer erros” distintos quando comparados aos demais componentes.

20

Ensembles

Page 21: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Essa necessidade de diversidade do erro dos componentes é, de certa

forma, intuitiva;

Se forem combinados componentes que apresentam um mesmo padrão de

erro, claramente não haverá nenhum incremento de desempenho:

Erros iguais para um mesmo subconjunto de estímulos de entrada implica em

acertos também coincidentes;

Esta combinação trará apenas um aumento no custo computacional, sem

resultados práticos de desempenho.

21

Ensembles

Page 22: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Ensembles e

a questão da

diversidade

22

Page 23: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Ensembles: a Questão da Diversidade

Os estudos iniciais sobre a combinação de componentes para problemas

de regressão foram feitos paralelamente por Perrone (1993) e Hashem

(1993; 1997), e tornaram-se um tópico intensamente investigado nos anos

subsequentes.

Esse interesse acabou por contribuir muito para o amadurecimento do

conceito de diversidade de erros em regressores, levando ao desenvolvimento

das seguintes teorias (Brown et al., 2005):

Ambiguity Decomposition, proposta por Krogh &Vedelsby (1995),

Bias-Variance-Covariance Decomposition, proposta por Ueda & Nakano (1996).

23

Page 24: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

De modo geral, estas teorias mostram que o erro quadrático médio de um

ensemble é criticamente dependente da correlação entre os erros de cada

componente;

Decomposição Bias-Variância de estimadores individuais:

Propõe que o erro de generalização de um estimador pode ser dividido em dois

componentes: bias e variância;

Bias: pode ser definido como uma medida do quão perto um dado estimador

está do seu alvo (em média, tomada em diferentes conjuntos de treinamento);

Variância: é uma medida do quão estável uma dada solução é.

24

Ensembles: a Questão da Diversidade

Page 25: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Estes dois componentes são conflitantes:

Tentativas de redução de bias levam a aumentos na variância e vice-versa;

Figura extraída de Brown (2004)

Compromisso ótimo

25

Ensembles: a Questão da Diversidade

Page 26: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Ambiguity Decomposition (Krogh &Vedelsby, 1995):

Considere um ensemble com combinação convexa de seus componentes, ou

seja:

Para uma dada amostra dos dados, a teoria de Ambiguity Decomposition mostra

que (d é o valor desejado):

ou seja, o erro quadrático do ensemble é garantidamente menor ou igual ao erro

quadrático médio de seus componentes.

onde fi é a saída do i-ésimo componente e fens a saída do ensemble.

26

Ensembles: a Questão da Diversidade

Page 27: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Ambiguity Decomposition (Krogh &Vedelsby, 1995):

Termo de Ambiguidade:

Mede a variabilidade das saídas dos componentes do ensemble, para a

amostra em questão;

É sempre não-negativo;

Quanto maior o seu valor, maior a redução do erro do ensemble;

Erro do Ensemble Termo de AmbiguidadeErro médio dos componentes

27

Ensembles: a Questão da Diversidade

Page 28: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Ambiguity Decomposition (Krogh &Vedelsby, 1995):

Termo de Ambiguidade:

No entanto, o aumento da variabilidade dos indivíduos também implica no

aumento do seu erro médio (decomposição bias-variância);

A diversidade sozinha não é suficiente: é preciso encontrar o equilíbrio ótimo

entre diversidade e acurácia individual para que se tenha o menor erro no

ensemble.

Erro do Ensemble Termo de AmbiguidadeErro médio dos componentes

28

Ensembles: a Questão da Diversidade

Page 29: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Ambiguity Decomposition (Krogh &Vedelsby, 1995):

Pergunta: É possível a existência de componentes que, individualmente,

apresentam erros menores que a média para alguma amostra! E eles podem até

mesmo ser melhores que o ensemble em termos de desempenho global! Por

que não usar estes componentes?

Erro do Ensemble Termo de AmbiguidadeErro médio dos componentes

Mas como selecionar estes componentes?

Não é possível escolhê-los de antemão.

29

Ensembles: a Questão da Diversidade

Page 30: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Ambiguity Decomposition (Krogh &Vedelsby, 1995):

A teoria de Ambiguity Decomposition nos diz que a combinação de

múltiplos preditores é, na média, melhor que a seleção aleatória de

preditores individuais.

Erro do Ensemble Termo de AmbiguidadeErro médio dos componentes

30

Ensembles: a Questão da Diversidade

Page 31: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

A teoria de Ambiguity Decomposition é válida para combinações convexas de

componentes em ensembles treinados em um único conjunto de dados;

Não leva em conta as possíveis distribuições de probabilidade dos

conjuntos de treinamento e nem das possíveis inicializações de pesos (no

caso de redes neurais);

Para atender a estes aspectos, Ueda & Nakano (1996) propuseram a teoria

de decomposição em Bias-Variância-Covariância:

Uma análise detalhada desta teoria pode ser encontrada em Brown (2004), bem

como uma comparação com a teoria de Ambiguity Decomposition.

31

Ensembles: a Questão da Diversidade

Page 32: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

No contexto de classificação de padrões, apesar da diversidade ser

reconhecidamente importante, ainda não existe uma definição rigorosa

sobre como as diferenças entre as saídas de cada componente contribuem

para sua acurácia;

Não existe uma definição fechada para o conceito de diversidade entre

classificadores;

Para o caso de dois classificadores, é possível derivar diversas

expressões heurísticas a partir da literatura de estatística mas, diante da

falta de uma definição exata, não existem análises formais e rigorosas

sobre o tema;

A situação é ainda pior quando se tem mais de dois classificadores.

32

Ensembles: a Questão da Diversidade

Page 33: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Tais expressões heurísticas podem ser divididas em duas categorias

(Kuncheva & Whitaker, 2003):

Aquelas que consistem em tomar a média de uma dada métrica de distância

entre todos os classificadores do ensemble (medidas do tipo par-a-par):

Estatística Q;

Coeficiente de Correlação (ρ);

Métrica de não-concordância (disagreement metric);

Medida de dupla-falta; etc...

Métricas que se baseiam em entropia ou na correlação de cada classificador com a

saída média dos classificadores:

Entropia;

Diversidade Generalizada; etc...

33

Ensembles: a Questão da Diversidade

Page 34: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Etapas de

Construção de

Ensembles

34

Page 35: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Ensembles: Etapas de ConstruçãoGERAÇÃO (treinamento)

SELEÇÃO

COMBINAÇÃO

x1

.

.

.

COMBINADOR

x2

.

.

.

1

2

3

4

N

x1

x2

1y

2y

3y

y

35

Figuras extraídas de

Puma-Villanueva

(2006)

Page 36: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

% Teste

DadosDisponíveis

%

Treina-

mento

% Validação

Geração dos

Componentes

% Seleção

Combinação

36

Figuras extraídas de

Puma-Villanueva (2006)

Ensembles: Etapas de Construção

Page 37: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

% Teste

DadosDisponíveis

%

Treina-

mento

% Validação

Geração dos

Componentes

% Seleção

Combinação

Geração de componentes: principal etapa em que

atuam os métodos de introdução de diversidade.

Seleção: nem sempre adotada.

37

Figuras extraídas

de Puma-Villanueva

(2006)

Ensembles: Etapas de Construção

Page 38: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Separação ideal dos dados:

Treinamento;

Validação;

Seleção;

Teste;

Nem sempre é possível fazer tal divisão, quando se tem um pequeno

número de amostras;

Divide-se então o conjunto de dados apenas em:

Treinamento,Validação (usado também na seleção) e Teste; ou

Treinamento (usado no treinamento e seleção) e Teste.

38

Ensembles: Etapas de Construção

Page 39: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Etapas de

Construção de

Ensembles

Seleção de Componentes

39

Page 40: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Exemplos de técnicas de seleção de componentes:

Construtiva sem exploração;

Construtiva com exploração;

Poda sem exploração;

Poda com exploração;

Uso de alguma meta-heurística (GA, Estratégia Evolutiva,ACO,...).

Seleção

40

Ensembles: Etapas de Construção

Page 41: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

MELHOROU

Seleção: Construtiva sem Exploração

• Ordena os candidatos de acordo com o seu desempenho individual;• Insere o segundo candidato de melhor desempenho individual e verifica se o

desempenho do ensemble melhorou. Caso tenha melhorado, o ensemble passa a ter

dois componentes. Caso contrário, o candidato inserido é removido.

Componente 4

Candidatos Ensemble

Componente 1

Componente 2

Componente 3

Componente 4

Componente 2

Componente 3

Componente 1

• Insere o melhor candidato no ensemble e avalia seu desempenho;• Repete o processo para os demais componentes.

Desempenho do Ensemble: PIOROU

Ensemble com 2 componentes.

41

Ensembles: Etapas de Construção

Page 42: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)42

Page 43: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)43

Page 44: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Seleção: Construtiva com Exploração

Esta técnica também inicia com a ordenação dos M candidatos e inserção

do de melhor desempenho no ensemble;

No entanto, ao invés de inserir o segundo candidato de melhor

desempenho individual, todos os M-1 restantes são considerados e aquele

que gerar o aumento de performance mais significativo no ensemble é

inserido;

Caso nenhum candidato melhore o desempenho do ensemble, o processo

é encerrado;

Caso haja melhoras, o processo continua e se repete para os demais M-2

candidatos;

44

Ensembles: Etapas de Construção

Page 45: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

MELHOROU

Seleção: Poda sem Exploração

Candidatos Ensemble

• Ordena os candidatos de acordo com o seu desempenho individual;• Repete o processo para os demais componentes, exceto para o de melhor

desempenho individual, que nunca é removido.

• Remove o candidato de pior desempenho individual e verifica se o desempenho do

ensemble melhorou. Caso tenha melhorado, o ensemble passa a ter M-1

componentes. Caso contrário, o candidato removido é re-inserido.

• Insere todos os candidatos no ensemble e avalia seu desempenho;

Componente 4Componente 1

Componente 2

Componente 3

Componente 4

Componente 2

Componente 3

Componente 1

Desempenho do Ensemble: PIOROU

Ensemble com 3 componentes.

45

Ensembles: Etapas de Construção

Page 46: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)46

Page 47: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)47

Page 48: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Seleção: Poda com Exploração

Nesta técnica os candidatos são novamente ordenados e inseridos no

ensemble;

No entanto, ao invés de se remover o de pior desempenho individual,

todos os candidatos são considerados exceto o melhor deles;

Aquele candidato que ao ser removido promove o maior aumento de

desempenho do ensemble é definitivamente excluído e o processo se

repete para os demais;

Caso nenhuma remoção produza um aumento na performance do

ensemble, o procedimento é encerrado.

48

Ensembles: Etapas de Construção

Page 49: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Seleção: Meta-heurística

Ex.: algoritmo de agrupamento (clusterização):

Candidatos Ensemble

Ensemble com 3 componentes.

49

Ensembles: Etapas de Construção

Page 50: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)50

Page 51: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Etapas de

Construção de

Ensembles

Combinação de Componentes

51

Page 52: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Regressão:

Média Simples:

Combinação

Classificação:

Voto Majoritário:

1y

2y

3y

200

175

190

=188,33

3

)190175200(

Média Ponderada sem bias;

Média Ponderada com bias;

...

Winner-takes-all;

...

1y

2y

3y

classe 1

classe 2

classe 1

classe 1

52

Figuras extraídas de

Puma-Villanueva (2006)

Ensembles: Etapas de Construção

Page 53: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Combinação: Regressão

Média ponderada sem bias:

Média ponderada com bias:

onde M é o número de componentes no ensemble, yk é a k-ésima saída do

ensemble, yik é a k-ésima saída do i-ésimo componente e pi é o peso

atribuído ao componente i;

53

Ensembles: Etapas de Construção

Page 54: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Combinação: Regressão

Para obter os pesos pi, basta resolver o seguinte problema:

sujeito a e

Esta restrição geralmente é adotada para evitar inversões das

saídas dos componentes (pesos negativos).

54

Ensembles: Etapas de Construção

Page 55: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

+0.3

-0.8Classificador 1:

+0.2

+0.9Classificador 2:

+0.7

+0.6Classificador 3:

Classe A

Classe B

Classe A

Combinação: Classificação

Winner-takes-all:

É uma técnica de combinação não-linear e elitista, onde a saída do ensemble

corresponde à saída do componente que possuir maior “certeza”:

Valor Máximo = +0.9

2ª saída do classificador 2

Classe B

55

Ensembles: Etapas de Construção

Page 56: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Etapas de

Construção de

Ensembles

Treinamento e Inserção de Diversidade

56

Page 57: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Na etapa de construção de ensembles, existem técnicas que tentam

explicitamente otimizar uma dada métrica de diversidade, enquanto que

outras não.

Isto nos permite fazer uma distinção entre essas duas abordagens,

classificando cada um dos métodos como:

Métodos implícitos; e

Métodos explícitos.

Os métodos implícitos se baseiam em aleatoriedades presentes na etapa de

treinamento para gerar diversidade.

Treinamento: inserção de diversidade

57

Ensembles: Etapas de Construção

Page 58: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Uma outra taxonomia, também relacionada à inserção de diversidade, pode

ser adotada para os métodos de treinamento de componentes.

Esta taxonomia se baseia na maneira como cada técnica atua sobre o

espaço de hipóteses:

Treinamento: inserção de diversidade

Hipótese: é cada mapeamento entrada-saída feito por um

componente do ensemble.

Espaço de Hipóteses: conjunto de todos os

mapeamentos possíveis de serem representados pelos

componentes em questão.

58

Ensembles: Etapas de Construção

Page 59: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos que atuam sobre o ponto de partida no espaço de hipóteses:

Os métodos incluídos neste grupo variam os pontos de partida da busca no espaço de

hipóteses, influenciando dessa forma o ponto de convergência.

Métodos que atuam sobre os dados de treinamento:

Buscam gerar componentes que produzam mapeamentos diferentes através do

fornecimento de conjuntos de dados de treinamento diferentes para cada um dos

componentes do ensemble (os estímulos de entrada serão distintos).

Treinamento: inserção de diversidade

59

Ensembles: Etapas de Construção

Page 60: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos que manipulam a arquitetura de cada componente:

Estes métodos variam a arquitetura de cada componente no ensemble, de maneira que

diferentes conjuntos de hipóteses estejam acessíveis para cada componente.

Ou seja, como os componentes do ensemble possuem arquiteturas diferentes, os

conjuntos de hipóteses associados a esses componentes também serão distintos, o

que pode contribuir para a diversidade.

Ex.: utilizar redes neurais MLP com diferentes números de neurônios nas camadas

intermediárias.

Treinamento: inserção de diversidade

60

Ensembles: Etapas de Construção

Page 61: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos que atuam sobre a forma de exploração do espaço de hipóteses:

Alterando a forma de exploração do espaço de hipóteses, esses métodos estimulam

os diferentes componentes a convergirem para diferentes hipóteses, mesmo tendo

um mesmo ponto de partida.

Métodos Híbridos:

Formados por alguma combinação dos métodos anteriores.

Treinamento: inserção de diversidade

61

Ensembles: Etapas de Construção

Page 62: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos que Manipulam

o Ponto de Partida no

Espaço de Hipóteses

62

Page 63: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Método implícito: inicialização aleatória dos pesos em um ensemble de redes

neurais do tipo MLP.

Vários autores mostraram que esta abordagem é uma das menos eficientes na

geração de diversidade (Sharkey et al.; 1995; Parmanto et al., 1996).

Método explícito: Maclin & Shavlik (1995) propuseram uma abordagem que

inicializa as redes em pontos distantes da origem do espaço de buscas,

tentando assim levar ao encontro do maior número possível de ótimos

locais.

Manip. do Ponto de Partida no Espaço de Hipóteses

63

Ensembles: Etapas de Construção

Page 64: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos que Manipulam

os Dados de Treinamento

64

Page 65: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Estes métodos buscam produzir diversidade através do fornecimento de

conjuntos de treinamento diferentes para cada um dos componentes;

É uma das formas de treinamento de ensembles mais pesquisadas;

Possibilidades:

Fornecer, a cada componente em treinamento, subconjuntos de amostras diferentes,

com todos os atributos do conjunto de treinamento original;

Fornecer todas as amostras presentes mas formando-se subconjuntos com atributos

diferentes;

Pré-processar os atributos de forma a obter uma representação diferente.

Manipulação dos Dados de Treinamento

65

Ensembles: Etapas de Construção

Page 66: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Manipulação dos Dados de Treinamento

Métodos de reamostragem

Métodos de distorção

66

Ensembles: Etapas de Construção

Page 67: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de reamostragem: Krogh &Vedelsby (1995)

Se baseia no k-fold cross-validation;

Para um ensemble com k componentes, divide aleatoriamente o

conjunto de dados em k subconjuntos disjuntos;

Gera-se o conjunto de treinamento para cada membro do ensemble

através da união de k1 subconjuntos, sendo que para cada membro do

ensemble um subconjunto distinto é deixado de fora.

Manipulação dos Dados de Treinamento

67

Ensembles: Etapas de Construção

Page 68: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de reamostragem: Bagging (Breiman, 1996)

Gera vários conjuntos de treinamento a partir de amostragem uniforme do

conjunto de dados, com reposição;

Utiliza cada um desses conjuntos para treinar cada componente do ensemble;

Os conjuntos de treinamento possuem o mesmo número de amostras que o

conjunto de dados original, mas algumas amostras podem ser selecionadas mais

de uma vez, o que consequentemente implica que podem existir amostras que

não são selecionadas;

Após a amostragem dos dados, permite o treinamento em paralelo dos

componentes.

Manipulação dos Dados de Treinamento

68

Ensembles: Etapas de Construção

Page 69: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de reamostragem: Boosting (Schapire, 1990)

Foi aperfeiçoado por Freund & Schapire (1995) e Freund (1995);

Os conjuntos de treinamento não são gerados via amostragem uniforme, como

no algoritmo Bagging;

A probabilidade de uma dada amostra ser escolhida depende da contribuição

desta para o erro dos componentes já treinados;

Amostras que apresentam maior erro quando submetidas aos componentes já

treinados têm maiores chances de comporem o conjunto de treinamento do

próximo componente a ser treinado;

Exige que o treinamento dos componentes seja feito sequencialmente;

Manipulação dos Dados de Treinamento

69

Ensembles: Etapas de Construção

Page 70: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de reamostragem: Boosting (Schapire, 1990) – cont’d.

O método mais popular é o AdaBoost (Freund & Schapire, 1996);

Cada componente é treinado sequencialmente;

A amostragem dos dados de treinamento é feita levando-se em conta os

erros do componente treinado na etapa imediatamente anterior.

Oza (2003) propôs uma variante do AdaBoost:

A distribuição das amostras depende dos erros de todos os componentes

treinados até o momento e não apenas do componente treinado na etapa

anterior.

Manipulação dos Dados de Treinamento

70

Ensembles: Etapas de Construção

Page 71: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de distorção: Sharkey et al. (1996)

Adiciona novos atributos gerados através de uma transformação aleatória;

Nesta transformação, os atributos originais são passados por uma RNA não

treinada.

Métodos de distorção: Raviv & Intrator (1996)

Aplicam uma amostragem como em Bagging, mas adicionando ruído gaussiano

aos dados de entrada.

Manipulação dos Dados de Treinamento

71

Ensembles: Etapas de Construção

Page 72: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de distorção: Liao & Moody (2000)

Agrupam os atributos de entrada de acordo com sua informação mútua

(variáveis estatisticamente semelhantes são agrupadas);

Os conjuntos de treinamento são formados por atributos selecionados de

grupos diferentes.

Métodos de distorção: Breiman (1998)

Propôs a adição de ruído à saída dos dados;

Os resultados foram superiores aos obtidos via Bagging mas próximos aos

obtidos via AdaBoost,

Manipulação dos Dados de Treinamento

72

Ensembles: Etapas de Construção

Page 73: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos que Manipulam

a Arquitetura dos

Componentes

73

Page 74: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

No caso de ensembles de redes neurais, as duas maneiras mais diretas de

variar a arquitetura de seus componentes são:

O uso de redes MLP com números distintos de camadas ocultas e de neurônios

nestas camadas;

O uso de redes neurais de diferentes tipos (ex.: MLPs, RBFs,...);

Partridge & Yates (1996) exploraram estas duas abordagens e concluíram

que (para um único conjunto de dados):

O uso de números diferentes de neurônios na camada oculta só não é pior que

inicializações aleatórias das redes (no aspecto diversidade);

Mistura de MLPs e RBFs é mais eficiente que variar o número de neurônios.

Manip. da Arquitetura dos Componentes

74

Ensembles: Etapas de Construção

Page 75: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Opitz & Shavlik (1996) utilizaram um algoritmo evolutivo para otimizar as

topologias dos componentes :

Cada componente foi treinado via backpropagation;

O processo de seleção visou otimizar métricas de diversidade.

Islam et al. (2003) propuseram o algoritmo CNNE (Cooperative Neural

Network Ensembles):

Gera ensembles construtivamente, monitorando a diversidade durante o processo;

É capaz de determinar automaticamente o número de redes neurais no ensemble e o

número de neurônios na camada oculta.

Manip. da Arquitetura dos Componentes

75

Ensembles: Etapas de Construção

Page 76: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Uma outra abordagem que se encaixa nesta categoria é o uso de

componentes de paradigmas distintos ensembles heterogêneos

Ex.: para um problema de classificação, um ensemble heterogêneo poderia ter redes

neurais e classificadores baseados em regras.

Os trabalhos nessa área mostram que o uso de diferentes paradigmas leva

a componentes com diferentes especialidades e precisões, que podem

apresentar diferentes desempenhos e, com isso, diferentes padrões de

generalização;

Esta especialização pode indicar que a seleção de um único componente ao invés da

combinação de todos eles pode ser mais vantajosa (Brown et al., 2005) mistura de

especialistas;

Manip. da Arquitetura dos Componentes

76

Ensembles: Etapas de Construção

Page 77: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Nesta linha, Langdon et al. (2002) utilizaram redes neurais e árvores de

decisão como componentes:

Aplicaram Programação Genética para evoluir uma regra de combinação dos

indivíduos;

Soares et al. (2006) utilizaram como componentes MLPs, RBFs,

classificadores naïve Bayes, máquinas de vetores suporte (SVM) e

classificadores baseados em regras;

Propuseram duas técnicas de seleção (baseadas em algoritmo de agrupamento e

k-nearest neighbors) que buscam não apenas reduzir o erro do ensemble, mas

também aumentar a diversidade de seus componentes.

Manip. da Arquitetura dos Componentes

77

Ensembles: Etapas de Construção

Page 78: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos que Manipulam

a Forma de Exploração

do Espaço de Hipóteses

78

Page 79: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Os métodos de criação de diversidade que atuam sob a forma de

exploração do espaço de hipóteses podem ser divididos em duas sub-

categorias:

Métodos de otimização convencional, como os chamados métodos de penalidades,

que adicionam um termo de custo (por ausência de diversidade) ao erro de cada

componente, buscando a criação de hipóteses diversas; e

Métodos de busca exploratória, onde estão os métodos de busca populacionais

que encorajam a diversidade na população de candidatos (ex. algoritmos

evolutivos).

Manip. da Forma de Expl. do Espaço de Hipóteses

79

Ensembles: Etapas de Construção

Page 80: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de Otimização Convencional:

Os métodos de treinamento individual de componentes normalmente têm como

objetivo minimizar o erro na saída de cada componente;

Geralmente se baseiam no gradiente da função de erro (ex.: backpropagation em

ensembles de RNAs);

Originalmente não têm nenhuma preocupação com a diversidade;

No caso de ensembles, além de reduzir o erro do componente sendo treinado,

deve-se também estimular a diversidade deste componente em relação aos demais

(já treinados ou em processo de treinamento simultâneo);

Manip. da Forma de Expl. do Espaço de Hipóteses

80

Ensembles: Etapas de Construção

Page 81: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de Otimização Convencional:

Diante disso, surgiram os chamados Métodos de Penalidade;

Nestes métodos, o erro de cada componente se torna algo como:

Manip. da Forma de Expl. do Espaço de Hipóteses

onde N é o número de amostras, fi é a saída do componente i, d é a saída desejada e

λ é um fator de ponderação do termo de penalidade Ri.

O termo de penalidade Ri está diretamente associado à diversidade do

componente i, e sua importância no treinamento é controlada por λ .

81

Ensembles: Etapas de Construção

Page 82: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de Penalidade:

Rosen (1996) usou o seguinte termo de penalidade em ensembles de redes

neurais:

Manip. da Forma de Expl. do Espaço de Hipóteses

onde c(j, i) é uma função de indicação que especifica quais redes i e j devem ser

descorrelacionadas entre si e pi é o produto das polarizações das i-ésima e j-ésima

redes, dado por:

onde fi é a saída da rede i, fj é a saída da rede j e d é a saída desejada.

82

Ensembles: Etapas de Construção

Page 83: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de Penalidade – Correlação Negativa:

Já Liu (1998) propôs uma extensão para o trabalho de Rosen (1996) que permite

o treinamento simultâneo das redes neurais;

Esta metodologia ficou conhecida como Correlação Negativa;

Nesta abordagem, o termo de penalidade é dado por:

Manip. da Forma de Expl. do Espaço de Hipóteses

onde é a saída média de todo o ensemble no passo anterior.

83

Ensembles: Etapas de Construção

Page 84: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de Penalidade – Correlação Negativa:

O método de Correlação Negativa foi aplicado com sucesso em vários

trabalhos, superando consistentemente o desempenho de outros ensembles;

Isto se dá pois a técnica de Correlação Negativa controla diretamente o termo de

covariância entre os componentes, ajustando assim a diversidade do ensemble

(Brown, 2004);

No entanto, esta técnica foi concebida especificamente para tratar problemas de

regressão.

Manip. da Forma de Expl. do Espaço de Hipóteses

http://www.cs.man.ac.uk/~gbrown/projects/nc/

84

Ensembles: Etapas de Construção

Page 85: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de Busca Exploratória:

Dentre os métodos de busca exploratória, os algoritmos evolutivos (Algoritmos

Genéticos, Estratégias Evolutivas, Programação Genética, etc.) exercem grande

importância nas aplicações atuais;

No entanto, na literatura de computação evolutiva, o termo diversidade possui

um conceito diferente do utilizado na literatura de ensembles;

Em computação evolutiva, a diversidade da população se refere à presença de

indivíduos que exploram regiões distintas do espaço de busca;

Manip. da Forma de Expl. do Espaço de Hipóteses

85

Ensembles: Etapas de Construção

Page 86: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de Busca Exploratória:

Com isso, a manutenção de uma população diversa de indivíduos permite uma

exploração maior do espaço de busca e, consequentemente, uma maior

eficiência na localização de soluções melhores.

Apesar dessas diferenças conceituais, alguns autores exploraram os mecanismos

de manutenção de diversidade, já desenvolvidos em computação evolutiva, junto

à questão de ensembles;

No trabalho de Yao & Liu (1998), uma população de redes neurais é evoluída e,

ao final, toda a população é combinada em um ensemble. Para estimular a

diversidade, foi utilizada a técnica de fitness sharing.

Manip. da Forma de Expl. do Espaço de Hipóteses

86

Ensembles: Etapas de Construção

Page 87: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de Busca Exploratória:

Já no trabalho de Khare & Yao (2002), tal conceito foi estendido para problemas

de classificação, com a utilização da entropia de Kullback-Leibler como métrica

de diversidade a ser otimizada durante a busca.

Um aspecto importante que deve ser ressaltado aqui é que, em ensembles,

deseja-se que os componentes apresentem diversidade de erros, o que pode ser

bem diferente de diversidade de indivíduos em uma população:

Ex.: Em redes MLP, duas redes com conjunto de pesos distintos (ou seja,

diversas) podem levar a um mesmo padrão de saídas, o que não é desejável

em um ensemble.

Manip. da Forma de Expl. do Espaço de Hipóteses

87

Ensembles: Etapas de Construção

Page 88: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Métodos de Busca Exploratória:

Diante disso, Coelho & Von Zuben (2006) propuseram a aplicação de um sistema

imunológico artificial para treinamento de redes MLPs que tratasse

especificamente desta situação;

Como as redes geradas ao final do treinamento seriam candidatas a formarem

um ensemble, o mecanismo de manutenção de diversidade do algoritmo foi

modificado de forma a não gerar redes de tal modo a produzir conjuntos de

pesos diversos durante o treinamento, mas redes com padrões de saída distintos

(não importando assim o grau de diversidade de seus vetores de pesos).

Manip. da Forma de Expl. do Espaço de Hipóteses

88

Ensembles: Etapas de Construção

Page 89: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Mistura de

Especialistas

89

Page 90: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Mistura de Especialistas

Mistura de Especialistas (ME) é uma proposta de comitê de máquinas na qual

o espaço de entrada é automaticamente dividido em regiões durante o

treinamento;

Se baseia no princípio de que estimadores são capazes de se especializar

no tratamento de regiões particulares do problema;

Com isso, para cada região existirá um único ou um subconjunto de

especialistas mais indicados para atuar;

O caráter dinâmico de MEs deve-se ao fato de que as regiões de atuação a

serem alocadas para os especialistas não são definidas a priori.

90

Page 91: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Responsável pelo aprendizado da ponderação apropriada dos especialistas para

cada entrada

91

Figuras extraídas

de Puma-Villanueva

(2006)

Mistura de Especialistas

Page 92: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)92

Figuras extraídas de

Lima (2004)

Mistura de Especialistas

Page 93: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)93

0 10 20 30 40 50 60 70 80 90 100-10

0

10

0 10 20 30 40 50 60 70 80 90 100-10

0

10

0 10 20 30 40 50 60 70 80 90 100-10

0

10

0 10 20 30 40 50 60 70 80 90 100-0.1

0

0.1

Expert 1

Expert 2

Output

Errors

Figuras

extraídas de

Lima (2004)

Mistura de Especialistas

Page 94: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

A interpretação probabilística da rede gating é de um sistema que calcula,

para cada especialista, a probabilidade dele gerar a saída desejada com base

apenas no conhecimento da entrada x;

Estas probabilidades são expressas pelos coeficientes gi, que devem ser

não-negativos e produzir soma unitária quando somados para cada x;

Os coeficientes gi variam em função da entrada x:

Caso permaneçam estáticos para todas as entradas, a mistura de especialistas se

torna um ensemble.

94

Mistura de Especialistas

Page 95: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Para M especialistas, a rede gating pode ser formada por uma rede neural

com uma única camada de M neurônios, sendo cada um deles associado a

um especialista da ME;

A ativação do i-ésimo neurônio para uma amostra x é dada por:

onde a soma é feita para todos os atributos xj ϵ x e wij é o peso associado à

entrada j pelo neurônio i.

ME de MLPs – Formulação Básica

95

Mistura de Especialistas

Page 96: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Os neurônios da rede gating têm função de ativação softmax, normalizada

para que a soma das saídas de todos os neurônios seja 1:

Por fim, a saída de todo o sistema é dada por:

onde fj é a saída do j-ésimo especialista.

ME de MLPs – Formulação Básica

96

Mistura de Especialistas

Page 97: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Para uma certa amostra (x,d) dos dados, a função de erro a ser minimizada

no treinamento é dada por:

Caso os especialistas sejam MLPs e o método de treinamento seja baseado

em gradiente, a atualização dos pesos dos especialistas será calculada a

partir da seguinte derivada parcial:

ME de MLPs – Formulação Básica

97

Mistura de Especialistas

Page 98: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Enquanto que a atualização dos pesos da rede gating usará:

ME de MLPs – Formulação Básica

98

Mistura de Especialistas

Page 99: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Mistura tradicional (ME):

Introduzida por Jacobs et al. (1991);

Tanto os especialistas quanto a rede gating são modelos lineares, com exceção

de que a rede gating possui função de ativação softmax (divide o espaço de

entrada com hiperplanos);

Mistura de Especialistas Gated (GE):

Introduzida por Weigend et al. (1995);

Emprega especialistas não-lineares;

Rede gating: MLP (divisão mais flexível do espaço de entradas);

Variações

99

Mistura de Especialistas

Page 100: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Mistura de Especialistas Localizados (LME):

Introduzida por Xu et al. (1995);

Usa kernel gaussiano normalizado para a rede gating (divide o espaço de

entradas com hiper-elipsóides suaves centrados nas regiões de atuação de cada

especialista);

Especialistas são modelos lineares ou não-lineares;

Variações

100

Mistura de Especialistas

Page 101: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Propostas de treinamento

101

Função-objetivo

Para uma rede gating com parâmetros v, especialista i com

parâmetros i e considerando todos os dados de entrada-saída

disponíveis, busca-se maximizar o somatório do produto das

probabilidades do especialista i fornecer a saída desejada e a rede

gating o escolher. Esta formulação reflete diretamente o objetivo

de que o especialista com a saída mais indicada para a respectiva

entrada seja aquele escolhido pela rede gating.

t i

ittt xyPvxiPl ),|(),|(log),( )()()(

Mistura de Especialistas

Page 102: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Propostas de treinamento

102

Função-objetivo

Aplicando o algoritmo de maximização da esperança

Logo

t i

ittt xyPvxiPl ),|(),|(log),( )()()(

t i

t

i

t

i

t

i

k yPghQ )}(log{log),( )()()()(

t l

tl

tl

v

k ghv )()(1 logmaxarg

t l

tl

tl

ki yPh

i

)(logmaxarg )()(1

Mistura de Especialistas

Page 103: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Referências

Bibliográficas

103

Page 104: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Breiman, L. (1996). Bagging predictors. Machine Learning, 24(2), 123–140.

Brown, G. (2004). Diversity in neural network ensembles. Ph.D. thesis, School of ComputerScience, University of Birmingham, UK.

Brown, G., Wyatt, J., Harris, R., & Yao, X. (2005). Diversity creation methods: A survey andcategorization. Journal of Information Fusion, 6(1), 5–20.

Coelho, G. P. (2006). Geração, Seleção e Combinação de Componentes para Ensembles de RedesNeurais Aplicadas a Problemas de Classificação. Dissertação de Mestrado, Faculdade deEngenharia Elétrica e de Computação, Universidade Estadual de Campinas, Brasil.

Coelho, G. P. & Von Zuben, F. J. (2006). “The Influence of The Pool of Candidates on thePerformance of Selection and Combination Techniques in Ensembles”. IEEE International JointConference on Neural Networks (IJCNN), Vancouver, British Columbia, Canada, pp. 10588–10595.

Freund, Y. (1995). Boosting a weak algorithm by majority. Information and Computation, 121(2),256–286.

Freund, Y., & Schapire, R. E. (1995). A decision-theoretic generalization of the on-line learning andan application to boosting. In Proceedings of the 2nd. European Conference on ComputationalLearning Theory, (pp. 23–27). Barcelona, Spain.

104

Referências: Ensembles

Page 105: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Freund, Y., & Schapire, R. E. (1996). Experiments with a new boosting algorithm. In M. Kaufmann(Ed.) Proceedings of the 13th International Conference on Machine Learning, (pp. 148–156). Bari,Italy.

Fumera, G., & Roli, F. (2003). Linear combiners for classifier fusion: Some theoretical andexperimental results. In T. Windeatt, & F. Roli (Eds.) Proceedings of the 4th. InternationalWorkshop on Multiple Classifier Systems, (pp. 74–83). Guilford, UK.

Geman, S., Bienenstock, E., & Doursat, R. (1992). Neural networks and the bias/variance dilemma.Neural Computation, 4(1), 1–58.

Hansen, L. K., & Salamon, P. (1990). Neural networks ensembles. IEEE Transactions on PatternAnalysis and Machine Intelligence, 12(10), 993–1001.

Hashem, S. (1993). Optimal linear combinations of neural networks. Ph.D. thesis, School ofIndustrial Engineering, University of Purdue, USA.

Hashem, S. (1997). Optimal linear combinations of neural networks. Neural Networks, vol. 10, no.4, pp. 599-614.

Hashem, S., Schmeiser, B., & Tih, Y. (1994). Optimal linear combinations of neural networks: Anoverview. In Proceedings of the IEEE International Conference on Neural Networks, (pp. 1507–1512). Orlando, USA.

105

Referências: Ensembles

Page 106: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Referências: EnsemblesIslam, M.M., Yao, X., &Murase, K. (2003). A constructive algorithm for training cooperative neural

network ensembles. IEEE Transactions on Neural Networks, 14(4), 820–834.

Khare, V., & Yao, X. (2002). Artificial speciation of neural network ensembles. In J. A. Bullinaria (Ed.)

Proceedings of theWorkshop on Computational Intelligence, (pp. 96–103). Birmingham, UK.

Krogh, A., & Vedelsby, J. (1995). Neural networks ensembles, cross validation, and active learning.

Advances in Neural Information Processing Systems, 7, 231–238.

Kuncheva, L., & Whitaker, C. (2003). Measures of diversity in classifier ensembles and their

relationship with the ensemble accuracy. Machine Learning, 51, 181–207.

Liao, Y., & Moody, J. (2000). Constructing heterogeneous committees using input feature grouping.

Advances in Neural Information Processing Systems, 12.

Lima, C. A. M. (2004). Comitê de Máquinas: Uma Abordagem Unificada Empregando Máquinas de

Vetores-Suporte. Tese de Doutorado, Faculdade de Engenharia Elétrica e de Computação,

Universidade Estadual de Campinas, Brasil.

Liu, Y. (1998). Negative correlation learning and evolutionary neural network ensembles. Ph.D.

thesis, University College, The University of New South Wales, Australian Defence Force Academy,

Australia.

106

Page 107: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Maclin, R., & Shavlik, J. W. (1995). Combining the predictions of multiple classifiers: Using

competitive learning to initialize neural networks. In Proceedings of the 14th International Joint

Conference on Artificial Intelligence, (pp. 524–530). Montreal, Canada.

Opitz, D.W., & Shavlik, J.W. (1996). Generating accurate and diverse members of a neural-network

ensemble. In Proceedings of the Neural Information Processing Systems Conference, (pp. 535–

541). Denver, USA.

Oza, N. C. (2003). Boosting with averaged weight vectors. In Proceedings of the 4th. International

Workshop on Multiple Classifier Systems, (pp. 15–24). Guilford, UK.

Parmanto, B., Munro, P.W., & Doyle, H. R. (1996). Improving committee diagnosis with resampling

techniques.Advances in Neural Information Processing Systems, 8, 882–888.

Partridge, D., & Yates, W. B. (1996). Engineering multiversion neural-net systems. Neural

Computation, 8(4), 869–893.

Pasti, R. (2007). Redes Neuro-Imunes Aplicadas a Classificação e Otimização Combinatória,

Dissertação de Mestrado, Universidade Católica de Santos (Unisantos), Brasil.

Pasti, R., & de Castro, L.N. (2009). Bio-inspired and gradient-based algorithms to train MLPs: The

influence of diversity. Information Sciences, vol. 179, pp. 1441-1453.

107

Referências: Ensembles

Page 108: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Pasti, R., de Castro, L.N., Coelho, G.P., & Von Zuben, F.J. (2010). Neural network ensembles:

immune-inspired approaches to the diversity of components. Natural Computing, vol. 9, no. 3, pp.

625-653, 2010.

Perrone, M. (1993). Improving regression estimation: Averaging methods for variance reduction

with extensions to general convex measure optimization. Ph.D. thesis, Institute for Brain and

Neural Systems, Brown University, USA.

Perrone, M. P., & Cooper, L. N. (1993). When networks disagree: Ensemble method for neural

networks. In R. J. Mammone (Ed.) Neural Networks for Speech and Image Processing, (pp. 126–

142). Chapman-Hall.

Puma-Villanueva, W. J. (2006). Comitê de Máquinas em Predição de Séries Temporais. Dissertação

de Mestrado, Faculdade de Engenharia Elétrica e de Computação, Universidade Estadual de

Campinas, Brasil.

Raviv, Y., & Intrator, N. (1996). Bootstrapping with noise: An effective regularisation technique.

Connection Science, 8, 355–372.

Roli, F., & Fumera, G. (2002). Analysis of linear and order statistics combiners for fusion of

imbalanced classifiers. In F. Roli, & J. Kittler (Eds.) Proceedings of the 3rd. International Workshop

on Multiple Classifier Systems, (pp. 252–261). Cagliari, Italy.

108

Referências: Ensembles

Page 109: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Rosen, B. E. (1996). Ensemble learning using decorrelated neural networks. Connection Science -

Special Issue on combining Artificial Neural Networks: Ensemble Approaches, 8(3-4), 373–384.

Seni, G., Elder, J. & Grossman, R. (2010) Ensemble Methods in Data Mining: Improving Accuracy

Through Combining Predictions, Morgan and Claypool Publishers.

Sharkey, N., Neary, J., & Sharkey, A. (1995). Searching weight space for backpropagation solution

types. In Current Trends in Connectionism: Swedish Conference on Connectionism, (pp. 103–

120).

Sharkey, A., Sharkey, N., & Chandroth, G. (1996). Diverse neural net solutions to fault diagnosis

problem. Neural Computing and Applications, 4, 218–227.

Tumer, K., & Ghosh, J. (1996). Error correlation and error reduction in ensemble classifiers.

Connection Science, 8(3-4), 385–403.

Ueda, N., & Nakano, R. (1996). Generalization error of ensemble estimators. In Proceedings of

IEEE International Conference on Neural Networks, (pp. 90–95).Washington, USA.

Yao, X., & Liu, Y. (1998). Making use of population information in evolutionary artificial neural

networks. IEEE Transactions on Systems, Man and Cybernetics, 28, 417–425.

Zhou, Z.-H. (2012). Ensemble Methods: Foundations and Algorithms, Chapman and Hall/CRC.

109

Referências: Ensembles

Page 110: Comitês de Máquinas

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT

Faculdade de Ciências Exatas e Tecnológicas – FACET / Sinop

Curso de Bacharelado em Engenharia Elétrica

REDES NEURAIS ARTIFICIAIS (Máquinas de Comitê)

Referências: Misturas de Especialistas

Jacobs, R. A.; Jordan, M. I.; Nowlan, S. J. & Hinton, G. E. (1991). Adaptive mixtures of local experts. Neural

Computation, vol. 3, no 1, pp. 79-8.

Lima, C. A. M. (2004). Comitê de Máquinas: Uma Abordagem Unificada Empregando Máquinas de Vetores-

Suporte. Tese de Doutorado, Faculdade de Engenharia Elétrica e de Computação, Universidade Estadual

de Campinas, Brasil.

Masoudnia, S. & Ebrahimpour, R. (2014). Mixture of experts: a literature survey, Artificial Intelligence

Review, vol. 42, pp. 275-293.

Puma-Villanueva, W. J. (2006). Comitê de Máquinas em Predição de Séries Temporais. Dissertação de

Mestrado, Faculdade de Engenharia Elétrica e de Computação, Universidade Estadual de Campinas,

Brasil.

Weigend, A. S.; Mangeas, M. & Sristava, A. N. (1995). Nonlinear gated experts for time series: Discovering

regimes and avoiding over fitting. International Journal of Neural Systems, vol. 6, pp. 373-399.

Xu, L; Jordan, M. I & Hinton, G. E. (1995). An alternative model for mixture of experts. In G. Tesauro, D. S.

Touretsky, and T. K. Leen, editors.Advances in NIPS, vol. 7, pp. 633-640, Cambridge MA, MIT Press.

Yuksel, S. E., Wilson, J. N. & Gader, P. D. (2012). Twenty years of mixture of experts, IEEE Transactions on

Neural Networks and Learning Systems, vol. 23, pp. 1177-1193.

110