Classificação Automática de Pedras de Mármore Polidoclassificação, nomeadamente as pedras de mármore. Todo o conhecimento que obtive sobre a indústria dos mármores e em particular

Classificação Automática de Pedras de Mármore Polido

João Miguel Pedro Batista

Dissertação para obtenção do Grau de Mestre em

Engenharia Mecânica

Orientadores: Prof. João Rogério Caldas Pinto

Prof. Susana Margarida da Silva Vieira

Júri

Presidente: Prof. Viriato Sérgio de Almeida Semião

Orientador: Prof. João Rogério Caldas Pinto

Vogal: Prof. João Miguel da Costa Sousa

Novembro 2015

i

Agradecimentos

Gostaria, antes de mais, de agradecer aos meus orientadores, Professor Caldas Pinto e à

Professora Susana Vieira, por todo o apoio prestado ao longo deste trabalho, pelo conhecimento

partilhado e pela confiança depositada para esta tarefa desempenhada no âmbito do projeto

UID/SEM/50022/2013 inserido no projeto global QREN “StoneScan” (2013/30369 “Sistema de

Incentivos à Investigação e Desenvolvimento Tecnológico”).

Agradeço também à empresa FrontWave por ter partilhado comigo um dos desafios da empresa,

o que me permitiu desenvolver uma capacidade crítica relacionada com o mundo industrial. Gostaria

também de agradecer à fábrica Grupo Galrão por ter disponibilizado o material para posterior

classificação, nomeadamente as pedras de mármore.

Todo o conhecimento que obtive sobre a indústria dos mármores e em particular a classificação

dos mesmos, devo às longas conversas com os Engenheiros da empresa FrontWave, Adriano Coelho

e Nuno Reis, sem eles não teria sido possível obter uma base de dados com todas as pré-

classificações necessárias ao desenvolvimento deste trabalho.

Quero deixar um especial agradecimento à minha colega de Laboratório Cátia Salgado pelo tempo

que despendeu para me ajudar e por todos os brainstormings construtivos. Sem esta ajuda preciosa

nunca teria conseguido obter estes resultados.

Agradeço aos meus pais pelo apoio e vontade de ajudar ao longo destes últimos meses.

À minha namorada por me dar uma grande ajuda na revisão deste documento, que a obrigou a

ganhar um sentido crítico de uma matéria fora da sua área de conforto, e nos momentos de maior

aflição ajudou-me a descontrair e a focar-me no que era importante. No entanto, para além do

trabalho, foi a pessoa que mais me proporcionou momentos únicos e memoráveis durante estes

últimos meses.

Nesta última fase do trabalho tenho a agradecer à companhia e acolhimento do Laboratório de

Bolhas e Gotas que me ajudaram a focar no objetivo final da entrega da tese.

Por fim, agradeço aos meus amigos que acompanharam todo o meu percurso académico pelos

momentos de descontração e de desabafo.

ii

iii

Resumo

Esta dissertação apresenta um estudo acerca da classificação automática de pedras de mármore

polidas baseadas na sua aparência visual. Este é um problema industrial complexo que até à data

não se conseguiu chegar a uma solução definitiva devido à grande variedade de cores e texturas de

mármores nas diversas geografias. Com a contribuição da empresa FrontWave e da fábrica do Grupo

Galrão foi possível obter um conjunto de amostras de estudo considerável.

Adotou-se uma metodologia baseada em Machine Learning (ML) supervisionado de classificação

com múltiplas classes, seguindo o método de avaliação one-vs-all. Como se tem como objetivo

classificar cores e texturas de mármores, os descritores das imagens foram obtidos através do método

de segmentação QuadTree. Os modelos de classificação aplicados neste trabalho foram: Regressão

Logística (RL) e sistemas fuzzy Takagi-Sugeno (TS) de primeira ordem baseados nos algoritmos de

clustering Gustafson-Kessel (GK) e Fuzzy c-Means (FCM).

Neste trabalho conseguiu obter-se classificações de cor com 3,9% de erro e 25 amostras de treino

para cada classe, e para textura classificações com 16,46% de erro com 30 amostras para treino.

Este último valor de erro, um pouco elevado, justifica-se pela elevada quantidade de mármores em

que os próprios peritos hesitam na atribuição de uma classe. Estes resultados foram obtidos por um

sistema de predição fuzzy TS baseado no algoritmo de clustering GK. Este sistema apresenta uma

cadência de classificação média de 2700 mármores por hora dependendo da homogeneidade da

pedra, visto que o processo mais moroso é o de segmentação de imagem.

Palavras-chave: ML supervisionado, segmentação QuadTree, múltiplas classes, regressão

logística, TS fuzzy models, GK clustering, FCM clustering, classificação automática de mármores.

iv

v

Abstract

This thesis presents a study on the automatic classification of polished marble stones based on

their visual appearance. This is a complex industrial problem that until now has failed to reach a

definitive solution due to the large variety of colors and textures of marbles in different geographies.

With the contribution of the company FrontWave and the factory of Galrão group, it was possible to

obtain a considerable number of study samples.

The methodology used was based on Machine Learning (ML) supervised classification with multiple

classes, followed by the evaluation method one-vs-all. As the final objective is to classify colors and

marble textures, the descriptors of the images were obtained through the Quadtree segmentation

method. The classification models used in this study were: logistic regression (LR) and first order fuzzy

Takagi-Sugeno systems (TS) based on the clustering algorithms of Gustafson-Kessel (GK) and Fuzzy

C-Means (FCM).

In this work one managed to get color classifications with 3,9% error for 25 training samples for

each class, and texture classifications with 16,46% error using 30 samples for training. The latter error

value, which can be considered a little high, is justified by the high amount of marbles in which the

experts themselves hesitate in assigning a class. These results were obtained for TS fuzzy prediction

system based on GK clustering algorithm. This system has an average rate of marble classification of

2700 per hour depending on the homogeneity of the rock due to the fact that the process of the image

segmentation is the most time consuming.

Keywords: ML supervised, QuadTree image segmentation, multi-classification, logistic regression,

TS fuzzy models, GK clustering, FCM clustering, automatic marble classification.

vi

vii

Índice Agradecimentos................................................................................................................................. i

Resumo ........................................................................................................................................... iii

Abstract ............................................................................................................................................ v

Lista de Figuras ............................................................................................................................... xi

Lista de Tabelas ............................................................................................................................. xiii

Nomenclatura ................................................................................................................................. xv

Introdução .................................................................................................................. 1

1.1. Motivação e Contexto ........................................................................................................ 1

1.2. Indústria de mármores em Portugal .................................................................................. 1

1.3. Estado de arte ................................................................................................................... 3

1.4. Objetivos e Contribuições .................................................................................................. 5

1.5. Estrutura ............................................................................................................................ 6

Metodologia de Classificação .................................................................................... 7

2.1. Content-based image retrieval .......................................................................................... 7

2.2. Knowledge Discovery ........................................................................................................ 8

2.2.1. Aquisição e Seleção de Dados .................................................................................. 9

2.2.2. Pré processamento ................................................................................................. 12

2.2.3. Seleção de atributos ................................................................................................ 12

2.2.4. Modelação ............................................................................................................... 14

2.2.5. Avaliação e Interpretação ........................................................................................ 16

Processamento de Imagem ..................................................................................... 19

3.1. Tratamento das amostras ................................................................................................ 19

3.2. Métodos de obtenção de descritores .............................................................................. 21

3.2.1. Descritores de cor.................................................................................................... 21

3.2.2. Descritores de textura ............................................................................................. 22

3.3. Segmentação QuadTree ................................................................................................. 23

3.3.1. Objetivos e metodologia do algoritmo ..................................................................... 23

3.3.2. Características da decomposição ........................................................................... 26

3.4. Definição dos atributos das observações ........................................................................ 27

viii

3.4.1. Atributos de cor considerados ................................................................................. 27

3.4.2. Atributos de textura considerados ........................................................................... 29

3.4.3. Normalização dos vetores de atributos ................................................................... 30

Modelos de Decisão ................................................................................................ 33

4.1. Regressão Logística ........................................................................................................ 33

4.2. Modelos Fuzzy ................................................................................................................. 34

4.2.1. Modelos Fuzzy Takagi-Sugeno ............................................................................... 36

4.3. Clustering ......................................................................................................................... 36

4.3.1. Fuzzy C-Means........................................................................................................ 37

4.3.2. Gustafson-Kessel .................................................................................................... 38

4.4. Múltiplos Classificadores ................................................................................................. 39

Discussão de Resultados ........................................................................................ 41

5.1. Segmentação QuadTree das amostras digitalizadas...................................................... 42

5.2. Procedimento para o cálculo dos índices de desempenho ............................................. 43

5.3. Parametrização dos modelos fuzzy................................................................................. 44

5.3.1. Gustafson Kessel Clustering ................................................................................... 44

5.3.2. Fuzzy C-Means Clustering ...................................................................................... 47

5.4. Model Assessment .......................................................................................................... 48

5.4.1. Avaliação da melhor percentagem de treino ........................................................... 49

5.4.2. Avaliação do melhor conjunto de descritores .......................................................... 52

5.5. Índices de performance dos modelos ............................................................................. 53

5.6. Classificação de novas amostras .................................................................................... 55

5.6.1. Classificação de cor dos conjuntos de amostras de verificação ............................. 56

5.6.2. Classificação de textura dos conjuntos de amostras de verificação ....................... 57

5.6.3. Classificação de cor e textura de amostras não consideradas no estudo dos modelos

de decisão 59

Conclusões e Trabalho Futuro ................................................................................ 63

Anexo A - Valores quantitativos dos diferentes métodos de clustering para a definição da

quantidade de clusters a considerar para os múltiplos classificadores. ............................................. I

A.1. GK clustering. ................................................................................................................. I

A.2. FCM clustering............................................................................................................... II

ix

Anexo B - Valores quantitativos dos diferentes modelos para a definição dos parâmetros a

considerar na modelação dos múltiplos classificadores de cor e textura. ....................................... V

B.1. Definição da percentagem de treino............................................................................. V

B.2. Definição do conjunto de descritores ........................................................................ VIII

Anexo C - Classificação das amostras de verificação (98 amostras) .................................. IX

C.1. Classificação nas diferentes Classes de Cor .............................................................. IX

C.2. Classificação nas diferentes Classes de Textura ........................................................ XI

Anexo D - Paper aceite no RecPad 2015 ........................................................................... XIII

x

xi

Lista de Figuras

Figura 1-1: Diagrama do processo na indústria dos mármores. ...................................................... 2

Figura 2-1: Fluxograma do algoritmo adaptado do CBIR. ............................................................... 8

Figura 2-2: Diagrama do processo do KDD, adaptado de [21]. ....................................................... 9

Figura 2-3: Instrumentação que compõe o protótipo StoneScan da empresa FrontWave. .......... 10

Figura 2-4: Diagrama dos algoritmos de seleção de atributos. a) Feature forward selection; b)

Feature backward selection................................................................................................................. 14

Figura 2-5:Esquema representativo da divisão de dados. ............................................................. 16

Figura 2-6: Representação das diferentes curvas ROC. ............................................................... 18

Figura 3-1: Pré processamento das amostras para n=9................................................................ 20

Figura 3-2: Diagrama do processo de decomposição QuadTree com 3 níveis. ............................ 24

Figura 3-3: Segmentação da amostra com três diferentes critérios de homogeneidade das regiões

e tempos associados a cada uma dessas decomposições. ............................................................... 26

Figura 3-4: Apresentação das regiões predominantes e das venadas. a) Contorno verde

corresponde às regiões predominantes e vermelho às venadas; b) Cores artificiais, verde corresponde

às venadas claras e vermelho às venadas escuras. .......................................................................... 27

Figura 3-5: Histograma dos tons de cinzentos da imagem global. ................................................ 28

Figura 4-1: Resposta da função da regressão logística [54]. ........................................................ 34

Figura 4-2: Configuração do sistema fuzzy, adaptado de [56]. ..................................................... 35

Figura 4-3: Diferenças entre distância Euclidiana (rosa) e Mahalonibis (azul), citado de [56]. ..... 38

Figura 4-4: Diagrama do sistema de classificação de cor e textura. ............................................. 40

Figura 5-1: Estrutura da metodologia para obter resultados de CDP generalizados. ................... 43

Figura 5-2: Resultados de CDP dos classificadores de Cor para método GK clustering com

diferentes clusters e percentagens de treino. a) ED_Art_Deco; b) ED_Rosa; c) ED_Trovoada; d)

ED_Pastel; e) FM_Art_Deco; f)FM_Sunset. ....................................................................................... 45

Figura 5-3: Resultados de CDP dos classificadores de Textura para método GK clustering com

diferentes clusters e percentagens de treino. a) Muito Homogéneo; b) Pouco Homogéneo; c) Nada

Homogéneo. ........................................................................................................................................ 46

xii

Figura 5-4: Resultados de CDP dos classificadores de Cor para método FCM clustering com

diferentes clusters e percentagens de treino. a) ED_Art_Deco; b) ED_Rosa; c) ED_Trovoada; d)

ED_Pastel; e) FM_Art_Deco; f)FM_Sunset. ....................................................................................... 47

Figura 5-5: Resultados de CDP dos classificadores de Textura para método FCM clustering com

diferentes clusters e percentagens de treino. a) Muito Homogéneo; b) Pouco Homogéneo; c) Nada

Homogéneo. ........................................................................................................................................ 48

Figura 5-6: Resultados de CDP dos classificadores de Cor para as diferentes percentagens de

dados de treino consideradas e diferentes modelos de classificação: a) Modelo fuzzy com GK

clustering; b) Modelo fuzzy com FCM clustering; c) Regressão Logística. ........................................ 50

Figura 5-7: Resultados de CDP dos classificadores de Textura para as diferentes percentagens de

dados de treino consideradas e diferentes modelos de classificação: a) Modelo fuzzy com GK

clustering; b) Modelo fuzzy com FCM clustering; c) Regressão Logística. ........................................ 51

Figura 5-8: Resultados das classes com piores valores de CDP dos métodos de classificação com

dados dos três conjuntos de descritores. a) Cor; b) Textura. ............................................................. 52

Figura 5-9: Resultados obtidos dos seis classificadores de cor para 98 novas amostras. ........... 56

Figura 5-10: Resultados obtidos dos três classificadores de textura para 98 novas amostras. .... 58

Figura 5-11: Amostras modelo das diferentes famílias de mármore estudadas. .......................... 59

Figura 5-12: Amostras modelo das diferentes famílias de mármore das amostras rejeitadas. ..... 59

Figura 5-13: Classificação de cor das amostras rejeitadas. a) ED_Art_Deco; b) ED_Rosa; c)

FM_Art_Deco; d) FM_Sunset; e) Indiferenciado. ................................................................................ 61

Figura 5-14: Classificação de textura das amostras rejeitadas. a) Muito Homogéneo; b) Pouco

Homogéneo; c) Nada Homogéneo. ..................................................................................................... 62

xiii

Lista de Tabelas

Tabela 2-1:Características da câmara linear e da câmara monocromática. ................................... 9

Tabela 2-2: Pré classificação das diferentes famílias pelos peritos da fábrica. ............................ 11

Tabela 2-3: Pré classificação das amostras nos três diferentes graus de homogeneidade

considerados. ...................................................................................................................................... 11

Tabela 2-4: Possíveis combinações das classificações reais e preditas. ..................................... 17

Tabela 3-1: Especificações do computador utilizado neste estudo. .............................................. 25

Tabela 3-2: Descritores considerados neste trabalho e valores máximos e mínimos de todas as

observações para cada critério de decomposição considerado na segmentação QuadTree. ........... 30

Tabela 5-1: Resulto da segmentação QuadTree das diferentes classes de textura para os

diferentes critérios de homogeneidade. .............................................................................................. 42

Tabela 5-2: Tempos de processamento da segmentação QuadTree. .......................................... 43

Tabela 5-3: Resultados de CDP do modelo fuzzy GK clustering para o classificador de

ED_Trovoada com a família de descritores 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 ..................................................................... 44

Tabela 5-4: Intervalos de tempo de segmentação para RawData5............................................... 53

Tabela 5-5: Índices de desempenho de GK para RawData5 com 40% de treino para as diferentes

classes de cor. ..................................................................................................................................... 54

Tabela 5-6: Índices de desempenho de FCM para RawData5 com 40% de treino para as diferentes

classes de cor. ..................................................................................................................................... 54

Tabela 5-7: Índices de desempenho de RL para RawData5 com 40% de treino para as diferentes

classes de cor. ..................................................................................................................................... 54

Tabela 5-8: Índices de desempenho de GK para RawData5 com 20% de treino para as diferentes

classes de textura. ............................................................................................................................... 54

Tabela 5-9: Índices de desempenho de FCM para RawData5 com 20% de treino para as diferentes


Tabela 5-10: Índices de desempenho de RL para RawData5 com 20% de treino para as diferentes


Tabela 5-11: Resultados de 𝒆𝒑𝒕, 𝑴 para classificação de cor. ...................................................... 57

Tabela 5-12: Resultados de 𝒆𝒑𝒕, 𝑴 para classificação de textura. ................................................ 58

xiv

xv

Nomenclatura

Acrónimos

ACC Accuracy.

AUC Area under the curve.

BRIEF Binary robust invariant elementary features.

BRISK Binary robust invariant scalable key points.

CBIR Content-based image retrieval.

CDP Critério de desempenho ponderado.

FCM Fuzzy c-Means.

FN False negative.

FP False positive.

FPR False positive rate.

GK Gustafson-Kessel.

GLCM Gray-level co-occurrence matrix.

HSV Hue, saturation, value.

KDD Knowledge discovery in database.

ML Machine learning.

OvA One-vs-all.

RGB Red, Green, Blue.

RL Regressão logística.

ROC Receiver-operating characteristic.

SIFT Scale-invariant feature transform .

SPC Specificity.

SURF Speeded-up robust features.

TIFF Tagged image file format.

TN True negative.

TP True positive.

TPR True positive rate.

TS Takagi-Sugeno.

xvi

Símbolos

𝑨𝒈 Matriz simétrica positiva.

𝑨𝒋,𝒌 Conjuntos fuzzy para a regra 𝑗 e atributo 𝑘.

𝒂𝒋 Vetor de parâmetros da função consequente fuzzy da regra 𝑗.

𝒃𝒋 Offset escalar da função consequente fuzzy de regra 𝑗.

𝒅𝒈,𝒏 Distância da amostra 𝑛 ao centro do cluster 𝑔.

𝒆𝒑𝒕,𝑴 Erro de classificação para a percentagem de dados de treino 𝑝𝑡 no modelo 𝑀.

𝒇𝒏 Função de predição da RL.

𝑷𝑪′ Atributo booleano de pertença para a classe 𝐶.

𝑷𝑪 Grau de pertença contínua para a classe 𝐶.

𝑷𝒈 Matriz de covariância do cluster 𝑔.

𝑷𝒊,𝒋 Matriz normalizada de GLCM.

𝑷𝒘,𝒊,𝒋 Valor do pixel do elemento de cor 𝑤 na dimensão 𝑖, 𝑗 da matriz.

𝑺𝒘 Assimetria do elemento de cor 𝑤.

𝒕𝑪 Threshold de pertença para cada classe 𝐶.

𝒗𝒈 Vetor de coordenadas do centro do cluster 𝑔.

𝒙𝒊,𝒋 Valor de intensidade de cor do pixel na dimensão 𝑖, 𝑗 da matriz.

𝒙𝒌𝒎𝒂𝒙 Valor máximo do atributo 𝑘.

𝒙𝒌𝒎𝒊𝒏 Valor mínimo do atributo 𝑘.

𝒙𝒏,𝒌 Valor do atributo 𝑘 da amostra 𝑛.

𝒙𝒏,𝒌𝒏𝒐𝒓𝒎 Valor normalizado do atributo 𝑘 para a amostra 𝑛.

𝑿𝒏 Variável explicativa de RL para cada amostra 𝑛.

𝒚𝒋 Função polinomial do consequente fuzzy para regra 𝑗.

𝒀𝒏 Variável de resposta de RL para cada amostra 𝑛.

𝝆𝒈 Constante de volume do cluster 𝑔.

𝒅𝒊𝒗𝑹𝒆𝒈 Variável lógica de decisão para segmentação.

𝑬 Valor esperado.

𝒆𝒙𝒑𝑺𝒕𝒅 Valor do parâmetro de segmentação.

xvii

𝒇𝒊𝒓𝒔𝒕𝑺𝒆𝒈 Número mínimo de regiões de segmentação de imagem.

𝒊𝒕𝒆𝒓𝒔𝑴𝑨𝟐𝟎_𝟖𝟎 Número de conjugações na seleção de 20% e 80% dos dados de modelação.

𝒊𝒕𝒆𝒓𝒔𝑴𝑨𝟒𝟎_𝟔𝟎 Número de conjugações na seleção de 40% e 60% dos dados de modelação.

𝑱 Número total de regras fuzzy.

𝑲𝒄𝒐𝒏𝒋 Número de conjuntos de dados para modelação/verificação.

𝒎 Grau de fuzziness dos clusters.

𝒎𝒊𝒏𝑨𝒓𝒆𝒂 Área mínima de cada região de imagem.

𝒏_𝒄𝒍𝒂𝒔𝒔𝒆𝒔 Número de classes a considerar.

𝒏_𝒑𝒆𝒓𝒄 Número de percentagens de dados de treino a considerar.

𝑵𝒂 Número total de amostras.

𝑵𝒑 Número de pixeis total.

𝑵𝒓𝒆𝒈𝒊𝒐𝒆𝒔 Número de regiões depois da segmentação.

𝑷𝒄𝒐𝒓(𝒏) Valor de classificação de cor para a amostra 𝑛.

𝑷𝒕𝒆𝒔𝒕(𝒏) Valor de classificação de textura para a amostra 𝑛.

𝒑𝑽𝒆𝒏 Percentagem da área total das venadas na imagem.

𝒑𝑽𝒆𝒏𝑪𝒍𝒂𝒓𝒐 Percentagem da área total das venadas claras na imagem.

𝒑𝑽𝒆𝒏𝑬𝒔𝒄𝒖𝒓𝒐 Percentagem da área total das venadas escuras na imagem.

𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 Conjunto de descritores obtidos da segmentação QuadTree com 𝑒𝑥𝑝𝑆𝑡𝑑 = 3.

𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 Conjunto de descritores obtidos da segmentação QuadTree com 𝑒𝑥𝑝𝑆𝑡𝑑 = 5.

𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟕 Conjunto de descritores obtidos da segmentação QuadTree com 𝑒𝑥𝑝𝑆𝑡𝑑 = 7.

𝒓𝒆𝒈𝑽𝒆𝒏 Variável lógica que define as regiões como venadas.

𝑹𝒑 Número de regiões predominantes.

𝑼 Matriz de partição fuzzy.

𝑽 Vetores de coordenadas dos centros dos clusters.

𝒗𝒂𝒓𝑽𝒄𝒍𝒂𝒓𝒐 Média do brilho das regiões consideradas venadas claras.

𝒗𝒂𝒓𝑽𝒆𝒏𝒂𝒅𝒂𝒔 Grau de percetibilidade da cor das venadas.

𝒗𝒂𝒓𝑽𝒆𝒔𝒄𝒖𝒓𝒐 Média do brilho das regiões consideradas venadas escuras.

xviii

Símbolos gregos

𝜷𝒋 Grau de ativação para a regra 𝑗.

𝜷𝒌 Parâmetros de cada atributo 𝑘 para RL.

𝝁𝑨𝒋𝒌(𝒙) Grau de pertença dos conjuntos fuzzy para a regra 𝑗 e atributo 𝑘.

𝝁𝒈,𝒏 Grau de pertença normalizado da amostra 𝑛 no cluster 𝑔.

𝝁𝒘 Média do elemento de cor 𝑤.

𝝅𝒏 Valor de probabilidade de êxito para RL.

𝝈𝒓 Desvio padrão de intensidade da região 𝑟.

𝝈𝒘 Desvio padrão do elemento de cor 𝑤.

1

Introdução

1.1. Motivação e Contexto

A classificação de pedras de mármore polidas na indústria é uma das fases de produção de

ladrilhos e é nesta fase que os lotes são definidos e posteriormente chegam ao consumidor.

Atualmente essa classificação é realizada por pessoas especialistas que agrupam os ladrilhos por

grau de semelhança de cor, venadas (zonas com elevada discrepância de cor com uma forma fina e

alongada) e manchas (zonas com elevada discrepância de cor com uma forma arredondada), no

entanto a classificação humana introduz um elevado grau de incerteza e inconsistência tendo em

conta a fadiga mental desenvolvida por um trabalhador com este tipo de funções ao longo de várias

repetições na classificação [1].

Esta classificação determina a qualidade do lote em função da aplicação das pedras, como por

exemplo, um cliente que necessite de pedra mármore rosa numa fachada, todos os ladrilhos desse

mesmo lote devem ter a cor predominante desejada para que não haja nenhuma pedra que destoe.

Uma vez que existem vários tipos de mármore provenientes de diversas geografias, não há, ainda,

grupos de classificação definidos de forma universal [2]. Cada pedreira classifica as pedras de acordo

com o tipo disponível para extração. A diferenciação entre pedreiras depende, não só do classificador

mas também do tipo de solo.

O aumento da exigência no design de edifícios impõe que os materiais escolhidos para o

acabamento apresentem uma qualidade visual com nível bastante elevado. A discrepância existente

entre a exigência do cliente e a capacidade de resposta da indústria é cada vez maior, principalmente

devido ao dispêndio de tempo existente para uma correta classificação dos ladrilhos. Identifica-se

então a necessidade de criar um sistema automático que realize esta classificação num menor

intervalo de tempo e com maior grau de fiabilidade. Para isso será necessário ter uma aplicação capaz

de capturar imagens das pedras e classificá-las de forma semelhante à realizada pelos operários

especializados.

Atualmente a área de visão computacional já possui diversos tipos de ferramentas para análise de

imagens que permitem retirar o máximo de informação das pedras e criar uma base de dados de

descritores para diversos tipos de mármores com cores predominantes e homogeneidades diferentes.

Para classificar automaticamente os ladrilhos a partir das características retiradas, é necessário

recorrer a métodos de decisão inteligente para ter uma classificação baseada em dados de treino de

forma a obter um modelo que classifique todas as novas amostras.

1.2. Indústria de mármores em Portugal

A atividade industrial de extração e transformação das rochas calcária e cristalinas em Portugal

está particularmente desenvolvida na designada “Zona dos Mármores”, região interior do Alentejo:

Borba, Estremoz e Vila Viçosa. A recolha, inventariação e o estudo do património e história desta

indústria assume elevada relevância para a realidade local e para o meio rural onde parte destas

2

indústrias se implantou no período entre 1852 e 1986. Neste âmbito foi apresentado em Seminário,

no dia 9 de Janeiro de 2015, em Vila Viçosa, um projeto – PHIM – Património e Historia da Indústria

dos Mármores [3].

O ciclo de produção deste tipo de pedra pode ser descrita em 7 fases, desde o trabalho nas

pedreiras até ao consumidor final, tal como apresentado na Figura 1-1.

Figura 1-1: Diagrama do processo na indústria dos mármores.

A primeira fase é caracterizada pela sondagem de solos e recolha de amostras para análise, com

o objetivo de descrever o material no terreno e posteriormente selecionar quais os terrenos para

extração. De seguida, ainda no terreno de extração (pedreira) extraem-se blocos de pedra perfurando

a rocha em locais específicos para criar uma fenda suficientemente extensa para que se consiga

separar um bloco do tamanho desejado. Com uma serra de mono lâmina ou mono fio a matéria-prima

é cortada em blocos mais pequenos de forma a ser possível o seu transporte para as fábricas.

Na fábrica dá-se inicio á terceira fase, onde os blocos são serrados em chapas com as espessuras

pretendidas. Esta fase utiliza máquinas de corte controladas manualmente e fios de serras rotativas

para transformar um bloco de pedra em chapas. A quarta fase é referente ao corte das chapas

serradas nas diversas medidas existentes. Este processo é elaborado com a máxima precisão para

o maior aproveitamento possível do material e geralmente é uma tarefa executada por uma máquina

de controlo numérico. A estes novos cortes dá-se o nome de ladrilhos e são esses que entram na

fase seguinte, de polimento e calibragem onde a espessura e arestas das pedras são analisadas e

Cliente Final

Mina de Pedra

Produção em SérieTrabalho personalizado

Extração Preparação de transporte

Ladrilhos Controlo de qualidade PolimentoClassificação e armazenamento

3

corrigidas se necessário, não esquecendo de polir um dos lados do ladrilho de forma a ter uma

superfície macia.

Para trabalhos mais elaborados, existe uma outra fase onde se fazem trabalhos específicos e

pormenorizados com uma máquina de corte CNC de 3 eixos ou manualmente por um

especialista/técnico para fazer as geometrias desejadas, formas ou até mesmo esculturas, sendo esta

uma fase da linha de produção intermitente.

A fase de conclusão deste processo é dedicada à embalagem e distribuição dos ladrilhos para o

consumidor final, sendo necessário fazer uma seleção manual dos ladrilhos pela cor e textura e criar

lotes homogéneos para garantir a entrega ao cliente sem qualquer anomalia ou defeito.

Esta classificação manual das pedras é um processo normalmente feito por especialistas através

de comparação com elementos já classificados anteriormente. No caso de existirem duas cores

predominantes, a classificação é feita considerando sempre a cor mais clara. No entanto, caso as

cores sejam muito semelhantes, os operadores classificam para o lote da classe que contém menos

unidades, consoante a procura instantânea do mercado.

1.3. Estado de arte

A otimização de recursos tem sido, nos últimos tempos, um tema bastante discutido na sociedade,

tanto recursos económicos como energéticos e materiais. Neste contexto, o desenvolvimento de

novas tecnologias e em particular a exploração de processos automáticos e inteligentes para os mais

diversos contextos tem tido um crescimento exponencial. Um dos processos que tem ganho, cada

vez mais importância no mundo tecnológico em que vivemos é a classificação automática de imagens,

como por exemplo análise de imagens raio x e outro tipo de imagens médicas [4] ou, num ambiente

mais industrial, a classificação de pedras naturais, como será tratado neste trabalho em que o enfoque

é dado para imagens de mármores.

Quando se pretendem desenvolver sistemas de classificação de imagens em diferentes

categorias, é necessário obter características relevantes das imagens para a distinção das mesmas.

No caso dos mármores, a cor é um fator de relevo e como tal todo o tipo de características globais ou

locais de cor poderão fazer parte da família de descritores. No entanto a preocupação de classificar

os mármores a nível da homogeneidade de cor tem vindo a aumentar cada vez mais. Deste modo

torna-se necessário recorrer a técnicas de decomposição de imagem em regiões de cor homogéneas

e assim retirar caraterísticas de textura.

Em trabalhos anteriores foram considerados diversos tipos de descritores de cor como por

exemplo Erdogan [5] que propõe um método de medição do brilho das pedras, o estudo de Carrino

et al [6] que propõe um sistema automático de visão integrada que se baseia simplesmente na

distribuição de cinzentos de cada mármore ou Cinque el al [7] que utiliza histogramas de diversos

espaços de cor. No entanto existem outros métodos baseados em wavelets e gray-level co-

occurrence matrix (GLCM) para obter descritores de textura e cor como apresentado no trabalho de

Alexandre et al [8], de Luis-Delgado et al [9] e de Sobral [10]. De acordo com os trabalhos de Caldas

4

Pinto et al [11, 12] a decomposição de imagem em diversas regiões homogéneas apresenta

resultados promissores no cálculo de descritores de cor e textura.

A obtenção dos descritores das imagens é uma fase muito importante neste tipo de problemas

dado que qualquer sistema inteligente utilizado para classificar novas amostras, irá recorrer a esses

descritores para obter graus de semelhança. Para um sistema inteligente que classifica novas

amostras de mármore é necessário fazer uma aprendizagem automática, ou machine learning (ML),

que extrai regras e padrões de grandes conjuntos de dados para posteriormente encontrar graus de

semelhança de novas amostras nos conjuntos conhecidos. Esta aprendizagem está relacionada com

data mining e estatística, dado que só é possível criar um sistema suficientemente robusto se os

descritores das imagens forem bem distintivos e se validar estatisticamente o desempenho dos

modelos de classificação criados com diversos conjuntos de dados de treino e teste.

Diversas técnicas de clustering supervisionado, como redes neuronais e modelos fuzzy otimizados

por um algoritmo genético, e não supervisionado, como simulated annealing e fuzzy c-means, foram

testadas por Caldas Pinto et al [13] que concluí que os métodos não supervisionados obtêm

resultados de menor concordância que os outros e é proposto que sejam combinados diferentes

métodos de clustering. Um trabalho consequente, Sousa e Caldas Pinto [14] apresentam, para além

das técnicas de classificação anteriores, a segmentação das imagens com o objetivo de separar as

características das venadas e do fundo da pedra (cor).

Mais tarde, Benavente e Pina [15] propõem uma classificação baseada em metodologias

fundamentadas através de morfologia matemática [16] e defendem que para uma melhor classificação

há a necessidade de segmentar as imagens para uma extração de características locais, o que

melhora a compreensão e detalhe de forma mais concreta a caracterização de ladrilhos de mármore

numa escala macroscópica.

Apesar de todos estes estudos já efetuados, foram poucos os trabalhos implementados em

sistemas industriais, no entanto o investigador Martinez-Cabeza-de-Vaca-Alajarín et al [17] expõe

uma abordagem através de reconhecimento de textura de ladrilhos de mármore com um método

baseado em Sum and Difference Histograms, o que se trata de uma versão mais rápida das Co-

ocorrence Matrices. O método utilizado para classificação é uma rede neuronal que obtêm boas

classificações dos mármores por textura e cores, no entanto apresenta um sistema com um tempo de

processamento elevado e afirma que não foi implementado em sistemas industriais de larga escala

pelo que não foi possível perceber o seu comportamento numa linha de produção em tempo real.

Com a tentativa de tornar este tipo de sistemas de classificação automática como um processo

padrão e aplicável a todos os tipos de fábricas de mármore, Irina Topalova [18] propõe um sistema

automático de classificação de placas de mármore baseado no treino de uma rede neuronal MLP com

três conjuntos de descritores de imagens diferentes: extração de histogramas de textura, Discrete

Cosine Transform (DCT) e Discrete Wavelet Transform (DWT) sobre os histogramas. Neste caso a

investigadora aplicou o sistema de classificação com Programmable Logic Controllers (PLC), uma vez

que a maioria das indústrias é constituída por este tipo de equipamentos, com o objetivo de alcançar

uma operação em tempo real. Conclui então que a utilização de conjuntos de treino DWT e DCT

5

apresentam maior exatidão quando comparados com a aplicação dos histogramas de texturas para

além de oferecerem maior flexibilidade em posterior redução do tempo computacional enquanto é

possível manter a exatidão na classificação.

Apesar dos estudos apresentados nas últimas décadas este é ainda um problema bastante

proeminente na indústria dos mármores uma vez que não existe um sistema comercial padrão que

se consiga utilizar para os diferentes tipos de pedras existentes ao longo da geografia mundial. Neste

trabalho aplicam-se alguns métodos e abordagens já referidos por outros autores com o objetivo de

desenvolver um sistema otimizado, que seja principalmente aplicável às amostras utilizadas em

Portugal.

1.4. Objetivos e Contribuições

Este trabalho tem como principal objetivo criar um sistema de classificação automática de

diferentes tipos de mármores através das diferenças de cor e textura, semelhante ao que já é feito

manualmente na indústria. Com a parceria de uma empresa, FrontWave, podem obter-se as imagens

digitais dos mármores, adquiridas através de um sistema automático de captura de imagem, o

protótipo StoneScan.

Com uma base de dados composta pelas amostras retiradas por este sistema e com uma pré

classificação feita pelos peritos da fábrica, é possível criar modelos de decisão baseados em sistemas

fuzzy e regressões logísticas que consigam classificar novas amostras de mármores de acordo com

a sua cor e homogeneidade. Como existe uma elevada variedade de mármores, e cada fábrica tem

os seus diferentes fornecedores de pedra, adotou-se uma abordagem de múltiplos classificadores

binários para cada classe de cor e textura das amostras cedidas pelo Grupo Galrão.

Os descritores das imagens dos mármores foram extraídos através de um método de

segmentação de imagem em que ao variar os critérios de decomposição de imagem, o desempenho

dos modelos considerados serão avaliados. Para se conseguir uma classificação rápida, a obtenção

dos descritores não pode ser muito demorada, e como tal, tem-se como objetivo o de verificar qual o

critério de decomposição em que os melhores resultados de modelação se obtém, considerando o

tempo de segmentação.

Será necessário também fazer um estudo estatístico para que a escolha dos modelos seja

independente de quais foram os dados escolhidos para treino e teste e concluir quanto à melhor

percentagem de dados de treino. Posteriormente, será simulado um sistema real em que novas

amostras de mármore serão avaliadas pelos modelos para validar os resultados obtidos na

modelação dos mesmos, concluindo assim o método de classificação a utilizar e a quantidade de

amostras que são necessária pré classificar.

Este trabalho contribui com o estudo de um novo sistema de classificação de mármores para a

comunidade de investigação, no entanto visa a ser instalado num sistema de industrial para uma

classificação rápida e precisa de mármores numa determinada fábrica, geografia ou galeria. Como se

adota uma abordagem de múltiplos classificadores, estes resultados poderão ser reproduzidos para

6

qualquer outra galeria, dado que este método cria classificadores para cada tipo de cor ou textura

com dados de todas as classes, seguindo a teoria de one-vs-all.

Para além de este sistema ser versátil, é possível classificar novas amostras como não

pertencentes às famílias existente, o que possibilita criar uma galeria de amostras rejeitadas e, se

houver necessidade, modelar um novo classificador. No entanto, também é possível utilizar este

sistema para responder à necessidade específica de um cliente querer encontrar uma família de

pedras de mármore semelhante a uma amostra pessoal, o que manualmente se torna uma grande

dificuldade.

Com este sistema implementado na indústria será possível criar novos classificadores sempre que

houver necessidade na produção e com uma pequena quantidade de amostras para treino, o que irá

facilitar bastante a pré classificação manual.

1.5. Estrutura

Esta dissertação encontra-se dividida em 6 capítulos, incluindo o presente enquadramento onde

é feita uma introdução à indústria dos mármores em Portugal e onde se apresenta o problema em

foco, contextualizando a relevância desta investigação e a sua contribuição para o estado da arte

atual.

O segundo capítulo apresenta toda a metodologia adotada neste trabalho descrevendo a teoria de

image retrieval e de todos os passos de Knowledge Discovery que consiste na aquisição de imagens,

pré processamento, seleção de atributos, modelação e avaliação. Ainda neste capítulo faz-se uma

descrição do sistema de aquisição de imagem utilizado para criar a base de dados das pedras de

mármore.

De seguida, no capítulo 3 descrevem-se todos os métodos de processamento de imagem

utilizados assim como o algoritmo de segmentação QuadTree para obter os descritores para

classificar os mármores em termos de cor e textura.

No capítulo 4 é apresentada a teoria dos modelos de decisão utilizados, Regressão Logística e

modelos fuzzy baseados em sistemas de inferência Takagi-Sugeno com técnicas de clustering

baseadas nos algoritmos de Gustafson-Kessel e Fuzzy c-Means. Ainda é descrito o método de

classificação de múltiplas classes utilizado.

No penúltimo capítulo são apresentados e discutidos os principais resultados obtidos tendo em

conta os objetivos e o propósito final do trabalho.

Finalmente no sexto e último capítulo apresentam-se as conclusões e propõe-se o trabalho a

desenvolver no futuro.

7

Metodologia de Classificação

Neste capítulo é apresentada a metodologia utilizada para a classificação de mármores de uma

determinada fábrica representativa de toda a sua indústria. Para se conseguir obter resultados

coerentes seguiu-se a metodologia utilizada na técnica Content-based Image Retrieval (CBIR) [19]

em que o processo de definição de padrões de classificação segue a metodologia de Knowledge

Discovery in Database (KDD) [20]. Assim é possível classificar a cor e textura dos mármores com

amostras nunca antes conhecidas através de comparação com a base de dados previamente

desenvolvida.

2.1. Content-based image retrieval

Na última década a quantidade de imagens disponíveis na internet tem vindo a aumentar

drasticamente e muitos motores de busca utilizam as palavras associadas às mesmas para fazer a

pesquisa, sem utilizar qualquer tipo de informação referente às características da imagem. Tornou-se

então necessário utilizar algoritmos que extraem atributos de baixo nível das imagens, como cor,

textura e formas, para procurar similaridades entre imagens [19]. Esta técnica exige a extração de

informação que o espaço de pixéis das imagens disponibiliza e guarda uma base de dados de

atributos definidos por vetores multidimensionais. Assim é possível criar modelos que comparem

novas amostras com as já existentes através dos vetores de atributos.

Com esta tecnologia a pesquisa torna-se muito mais eficiente, deixando de ser necessário ter as

imagens associadas a uma palavra, uma vez que passam a pertencer a uma categoria. Na ótica do

utilizador, o seu trabalho fica bastante facilitado pois a pesquisa torna-se mais vasta e concreta

simultaneamente.

Neste trabalho o universo de informação disponível está restringido pelas pedras que foram

disponibilizadas digitalmente e, como tal, só será possível criar classificadores para esses mesmos

mármores. Na Figura 2-1 encontra-se representado um fluxograma da adaptação do método CBIR

para os objetivos propostos no capítulo 1.

Existem duas fases nesta metodologia que são designadas da seguinte forma:

Conhecimento de dados, 1 – encontra padrões e define modelos de decisão para um

universo de dados com amostras de diversos tipos de mármores. Utiliza a metodologia do

processo de aprendizagem KDD. Com a diversidade de tipos de mármores existentes nas

diferentes fábricas, foi necessário criar classificadores distintos para cada cor e

homogeneidade para que fosse possível dividir os diferentes mármores em classes.

Predição de amostras, 2 – classifica novas amostras através de todos os classificadores

previamente modelados. O objetivo é chegar a uma classificação final que especifique

qual a cor e nível de homogeneidade com um algoritmo de computação simples através

de modelos de decisão com um elevado grau de precisão.

8

Figura 2-1: Fluxograma do algoritmo adaptado do CBIR.

A extração de atributos é explicada no capítulo 3 e é o primeiro processo a considerar para que a

base de dados de atributos seja definida. Neste capítulo serão ainda explicados os processos KDD e

de classificação nas secções 2.2 e 2.3, respetivamente.

2.2. Knowledge Discovery

A quantidade de dados digitalizada para a resolução deste problema foi significativamente grande

e como tal torna-se impossível fazer uma avaliação humana de todos os dados para fazer uma boa

classificação. Todas as amostras retiradas na fábrica foram pré classificadas pelos operadores

especializados, e é com base nessas informações que se desenvolve um novo processo de

classificação, recorrendo a novas técnicas e ferramentas computacionais que se tornaram temas

populares para os investigadores.

De acordo com Fayyad [21], o processo de KDD é bastante útil para criar modelos de decisão para

problemas de classificação. Este método serve para encontrar padrões nos dados que possam ser

utilizados em diversos métodos de modelação e, dado a enorme variedade de escolhas, é necessário

fazer várias repetições até se obter uma boa avaliação dos modelos desejados. Na Figura 2-2 são

apresentados todas as etapas deste processo, tendo como objetivo obter uma base de conhecimento

dos dados.

Base de dados de imagens

Nova imagem

Procura de semelhanças

1 2

KDD Classificação

Modelos guardados

Resultado

Resultado

Base de dados de atributos

Extração de atributos

Procura de semelhanças

1

2

9

Figura 2-2: Diagrama do processo do KDD, adaptado de [21].

No entanto, deve considerar-se que apesar de se ter um procedimento estabelecido, não é

necessário seguir os passos da mesma forma, pode ser possível fazer repetições iterativas de forma

recursiva para algumas das etapas até se obterem resultados satisfatórios. Neste trabalho o método

de KDD serve como referência e de seguida será apresentada a descrição de cada passo.

2.2.1. Aquisição e Seleção de Dados

A obtenção de amostras para este trabalho foi realizada através da instalação StoneScan da

empresa FrontWave e as pedras foram cedidas pela fábrica de mármores do Grupo Galrão com as

suas classificações. Esta instalação é composta por um tapete rolante, duas câmaras e um laser

vermelho em lâmina. As câmaras utilizadas neste protótipo foram:

Câmara monocromática (acA2500-14gm): é composta por um sensor monocromático

com três filtros de cor, que capta a intensidade de luz das cores vermelho, verde e azul.

Isto torna-a especialmente utilizada quando se pretende retirar características de imagem

que disso dependam.

Câmara linear (Spyder3-2K, 18 kHz CL): é composta por duas linhas de filtros de cor,

sendo que a primeira filtra a intensidade de luz para Vermelho e Azul e a segunda só filtra

para a cor Verde. Este, tal como o nome indica, digitaliza uma linha de pixéis a uma

determinada frequência que possa ser compatível com o movimento da amostra no tapete.

Tabela 2-1:Características da câmara linear e da câmara monocromática.

acA2500-14gm Spyder3-2K, 18 kHz CL

Resolução 2592x1944 pixéis 2048 pixéis x2

Taxa de aquisição 14 Hz 18 kHz

Tamanho do píxel 2.2 µm 14 µm

Tipo de Sensor CMOS CCD

Os ladrilhos de mármore são colocados na máquina manualmente e com o movimento constante

do tapete rolante, a amostra passa no feixe de laser, criando um degrau nas suas fronteiras que será

detetado pela câmara monocromática. Com esta informação é possível criar um perfil da pedra,

Dados Dados considerados Dados pré processados Dados reduzidos Procura de padrões Conhecimento

Aquisição e seleção de dados Pré processamento Seleção de atributos Modelação Avaliação e interpretação

10

ficando a saber-se a sua orientação, tamanho e imperfeições no corte do ladrilho. De seguida passa

por um ambiente de luz controlado enquanto digitaliza, com qualidade, a pedra através da câmara

linear orientada a 90º. Com um algoritmo simples consegue-se facilmente recortar a imagem que a

câmara linear digitalizou com o perfil definido pela câmara monocromática. Na Figura 2-3 é

apresentada a máquina criada pela FrontWave, denominada StoneScan, com a demonstração de

toda a instrumentação envolvente.

Figura 2-3: Instrumentação que compõe o protótipo StoneScan da empresa FrontWave.

Com o total de 595 amostras digitalizadas de 11 diferentes tipos de mármores disponíveis, foi

necessário fazer uma pré seleção da base de dados, considerando apenas os 6 tipos de mármores

com mais amostras disponíveis. Estas famílias de mármores selecionadas têm um total de 487

amostras e são denominadas por: ED Art Deco, ED Rosa, ED Trovoada, ED Pastel, FM Art Deco e

FM Sunset.

Neste universo de cores consegue ter-se uma boa perceção da cor, no entanto, há algumas

semelhanças de cor entre elas e poderão ser sujeitas a uma troca devido à subjetividade desta mesma

pré classificação. Pode também verificar-se que dentro de cada família de cor existem diferentes

graus de homogeneidade, caracterizada pela quantidade de venadas existentes na pedra. Atualmente

não existe uma especial preocupação dos peritos pela divisão dos diferentes níveis de

homogeneidade mas como existem clientes mais exigentes ao ponto de pretenderem lotes de

mármores completamente homogéneos, tornou-se necessário fazer uma pré classificação para a

textura. Assim torna-se necessário estudar novos métodos de classificação para satisfazer todos os

clientes.

Esta escolha teve em conta o balanceamento das diferentes famílias de mármores e a existência

de várias texturas. Na Tabela 2-2 são apresentadas as diferentes famílias de mármores selecionadas

Câmara monocromática

Câmara linear

Laser linear vermelho

11

e pré classificadas pelos peritos da fábrica através da sensação de cor e na Tabela 2-3 as diferentes

famílias de textura ou homogeneidade.

Tabela 2-2: Pré classificação das diferentes famílias de cor pelos peritos da fábrica.

ED Art Deco

(70 amostras)

ED Rosa

(87 amostras)

ED Trovoada

(150 amostras)

ED Pastel

(60 amostras)

FM Art Deco

(60 amostras)

FM Sunset

(60 amostras)

Tabela 2-3: Pré classificação das amostras nos três diferentes graus de homogeneidade considerados.

Muito Homogéneo

(98 amostras)

Pouco Homogéneo

(287 amostras)

Nada Homogéneo

(102 amostras)

12

Consegue observar-se através deste pequeno universo que cada família de mármore pode ter

mais do que um nível de homogeneidade. Assim pode constatar-se que a necessidade de criar um

modelo de decisão para textura é efetivamente uma preocupação da indústria. Esta pré classificação

foi mais difícil do que a anterior porque só existem 3 famílias de textura e como existem diversas cores

os peritos afirmam que esta divisão pode sofrer mais alterações na sua classificação.

Para criar modelos de decisão que consigam classificar com um bom desempenho é necessário

criar um conjunto de atributos que consiga efetivamente definir as diferentes cores e texturas. Assim

recorreu-se a métodos de processamento de imagem para se tornar possível extrair as informações

desejadas. No capítulo 3 explica-se com maior detalhe os métodos testados e as características a

utilizar nos modelos de classificação de cor e homogeneidade.

2.2.2. Pré processamento

Esta etapa é essencial quando se está a lidar com um universo de dados de grandes dimensões,

origens diferentes e com muitas variáveis. Assim torna-se difícil criar uma base de dados completa,

com ausência de ruído, sem erros ou até com inexistência de valores de atributos discrepantes e

incompreensíveis [22].

Dado que todas as amostras dos mármores foram obtidas pessoalmente e com rigor, não existem

amostras corrompidas. Foi um processo demorado porque o protótipo StoneScan ainda não estava

totalmente testado e funcional. Como tal algumas digitalizações não eram bem-sucedidas, o que

obrigava a parar a máquina para identificar o problema. Estes erros deviam-se muitas vezes à

dificuldade de traçar o perfil da pedra porque a câmara monocromática podia não identificar com

precisão o desnível do laser. Consecutivamente o processo era repetido com parâmetros diferentes

até se conseguir digitalizar a amostra corretamente.

Como o objetivo de evitar o tipo de erros referido utilizou-se sempre a mesma calibração da câmara

linear, construindo o vetor de atributos da base de dados das imagens com os mesmos parâmetros

de cor, o que resulta de neste trabalho não haver problemas de amostras corrompidas, ruidosas ou

até mesmo discrepantes e incompreensíveis. Com esta base de dados rigorosamente criada, os

atributos extraídos de cada amostra não contêm qualquer tipo de erros que necessite de pré

processamento.

2.2.3. Seleção de atributos

Quando se tem muita informação das amostras torna-se necessário fazer uma seleção das

características para melhorar o tratamento de dados na modelação dos sistemas de decisão. Procura-

se escolher as características que melhor representam os dados para eliminar a redundância das

mesmas. Esta etapa é bastante importante quando se está a lidar com base de dados que contenham

muita informação, o que normalmente acontece devido a geralmente não existir um objetivo concreto

para essa mesma base de dados.

13

Existem duas fases em que estes métodos de seleção podem ser divididos: extração e seleção de

atributos. A extração de atributos tem como objetivo obter novas características a partir dos dados

iniciais e os métodos de seleção definem quais os atributos mais relevantes de forma a definir novos

conjuntos de atributos a partir dos iniciais. A extração de atributos é explicado no capítulo 3, tendo a

base de dado um total de 487 observações referentes a 6 famílias de mármores.

A seleção de atributos serve para reduzir a quantidade dos dados, o que permite beneficiar de um

menor espaço de armazenamento para a informação retirada das amostras e o tempo de

processamento torna-se menor devido à menor dimensão de atributos, facilitando a visualização e

compreensão dos dados [23]. No entanto tem-se um compromisso de preservar a informação para

uma boa classificação e a sua eficiência depende da quantidade de dados do problema. A ideia

principal é encontrar um subconjunto de atributos onde todos sejam relevantes e não-redundantes,

maximizando o critério de avaliação desejado. De acordo com [24], há quatro categorias de seleção

que se baseiam nos seguintes métodos: filtros, wrappers, híbridos e incorporados.

O método que utiliza filtros avalia cada atributo ou combinações de atributos através de medidas

de entropia, redundância ou índices de relevância baseados em coeficientes de correlação entre as

características, sem a necessidade de envolver algoritmos de machine learning (ML) [25]. Com os

atributos ordenados através das diferentes medidas calculadas destacam-se os 𝑘 atributos mais

relevantes para que seja possível agrupar em subconjuntos, descartando os restantes que se

identificam como desnecessários. Este método não obriga a uma grande exigência computacional

mas apresenta algumas lacunas como, por exemplo, a ausência de relação entre o método e o

algoritmo de classificação a utilizar e a escolha da quantidade de atributos.

A metodologia de wrappers envolve os algoritmos ML e como tal torna-se vantajosa em relação

aos filtros por considerar o algoritmo de classificação. Com o critério de avaliação definido, procura-

se perceber qual o melhor subconjunto de atributos que obtém melhores resultados na classificação,

no entanto este é um processo iterativo o que implica um maior dispêndio de tempo quando

comparado com o método de filtros, o que consequentemente exige um maior processamento

computacional.

Para minimizar os problemas destes dois métodos de seleção pode ser criado um método hibrido

que primeiro utiliza os filtros para reduzir o universo de atributos e posteriormente utiliza o algoritmo

wrapper para escolher os mais relevantes de acordo com o critério de seleção dos algoritmos

utilizados no processo ML. Para finalizar os métodos incorporados que utilizam simultaneamente os

processos acima descritos e criam um subconjunto de atributos através da avaliação dos modelos no

processo de treino.

No entanto, o método mais utilizado para a seleção de atributos é o principal component analysis

[26, 27] ou análise de componentes principais. A metodologia deste método passa por 4 passos:

1. Normalização dos atributos;

2. Matriz de covariância;

3. Vetores próprios e valores próprios;

14

4. Escolha das componentes e formação do novo vetor de atributos.

Dos atributos obtidos para cada amostra, é necessário fazer uma normalização dos dados para

que cada vetor de atributo possua uma média nula (diferença do valor de cada observação com a

média do atributo). De seguida é necessário calcular uma matriz de covariância para ser possível

extrair vetores e valores próprios dos dados. Observando para os resultados obtidos, o vetor próprio

que contem o maior valor próprio é considerado a componente principal. Para a escolha das

componentes que melhor caracterizam os dados é necessário ordenar por ordem decrescente os

valores próprios dos respetivos vetores próprios. Assim escolhem-se os vetores com os valores

próprios maiores e rejeitam-se os seguintes que são menos significantes de forma a não perder muita

informação dos dados iniciais.

Existe também a possibilidade de fazer uma seleção de atributos através de uma análise

estatística dos índices de desempenho dos modelos para diferentes combinações de atributos

escolhidas de duas formas, forward selection e backward selection [23]. A grande diferença entre

estes dois métodos é a inicialização da escolha, sendo que na opção de forward selection se procura

a melhor combinação de atributos começando com um atributo e adiciona-se sucessivamente novos

atributos Figura 2-4 a). Este método tende a produzir subconjuntos com menos atributos e tem a

capacidade de eliminar os atributos redundantes. No backward selection inicializa-se o processo com

todos os atributos e vai-se removendo sucessivamente até se obter o melhor subconjunto Figura 2-4

b). Este método produz melhores resultados em termos de precisão mas por outro lado requere uma

grande exigência computacional.

Figura 2-4: Diagrama dos algoritmos de seleção de atributos. a) Feature forward selection; b) Feature backward selection.

Neste trabalho as amostras foram obtidas já com o propósito de criar múltiplos classificadores

através de modelos de decisão para diferentes famílias de cor e textura. Os atributos obtidos das

imagens foram cuidadosamente escolhidos para representar da melhor forma a informação

necessária. Considera-se então todas as características retiradas das imagens para treinar os

modelos de decisão e posteriormente prever a sua classificação.

2.2.4. Modelação

Com o conjunto de observações e atributos já definido, a fase de modelação tem como objetivo

encontrar relações entre os atributos para que seja possível definir regras de classificação. Existem

diversos métodos que podem ser aplicados para criar modelos, no entanto aqueles que melhor se

a)

…

…

…

b)

…

… … …

… … …

15

adaptam a um problema desta natureza são baseados em ML, reconhecimento de padrões e

estatística, como classificação, clustering ou regressão.

Na utilização de ML não supervisionada o grande objetivo é encontrar na estrutura total dos dados

um padrão para a definição de diferentes grupos, de acordo com as suas semelhanças. Este é um

problema complexo dado que não existe nenhum critério de comparação que seja globalmente aceite,

uma vez que a classificação do resultado obtido é subjetiva à interpretação do utilizador [28].

Para ML supervisionada cada observação necessita de ter uma pré classificação com o objetivo

de criar padrões entre os atributos para cada classe especificada [29]. Neste trabalho adotou-se esta

abordagem para múltiplas classes de modo a que os resultados obtidos sejam representativos para

outros conjuntos de amostras. A estratégia utilizada para os diferentes classificadores binários é

denominada de “one-vs-all” (OvA) que se caracteriza pelo treino de classificadores únicos para cada

família, em que as amostras pré classificadas dessa mesma família são positivas e as restantes

amostras negativas, o que resulta de um treino de conjuntos de dados desbalanceados para cada

classificador.

Assim, para cada conjunto de dados, realiza-se uma divisão em dois subconjuntos:

treino/validação e teste. Com os dados de treino/validação, ou de modelação, é possível avaliar os

modelos através de índices de desempenho e, devido à quantidade de iterações necessárias para se

concluir qual o melhor modelo, torna este processo de aprendizagem demorado [29]. No entanto, os

dados de teste servem para fazer a classificação dos mármores através dos múltiplos classificadores

binários que representam os melhores critérios de desempenho na modelação e concluir quanto à

validade dos resultados obtidos através da percentagem de erro de classificação.

Os dados de teste foram selecionados de uma forma aleatória com 20% do total de dados para

cada classe. De forma a variar a semente que gera os valores pseudoaleatórios de seleção das

amostras, este processo foi repetido 5 vezes, originando 5 subconjuntos diferentes de teste (𝐾𝑐𝑜𝑛𝑗)

com aproximadamente 98 amostras. Assim, cada conjunto de modelação corresponde a 80% do total

de dados para cada classe.

Uma vez que se têm diferentes formas de selecionar os dados de modelação, torna-se necessário

dividi-los em grupos de dados de treino com diferentes percentagens para estudar o impacto que a

quantidade de amostras de treino têm nos modelos de decisão. Para avaliar a capacidade de

generalização de um modelo a partir de um conjunto de dados, em que o objetivo da modelação é a

predição, adotou-se a técnica de validação cruzada [30] com o método 5-fold para dividir os dados de

modelação em dois subconjuntos mutuamente exclusivos, treino (estimação dos parâmetros) e

validação. Com diferentes combinações de seleção de dados, torna-se possível definir subconjuntos

de treino com diferentes percentagens de treino, 20%, 40%, 60% e 80%, dos dados de modelação, o

que equivale a 80, 160, 240 e 320 amostras, respetivamente. Este processo foi repetido 10 vezes

para a semente que gera os valores pseudoaleatórios de seleção das amostras seja variada. Na

Figura 2-5 pode observar-se um diagrama representativo da divisão total dos dados.

16

Figura 2-5:Esquema representativo da divisão de dados.

Como se pode verificar existem cinco formas diferentes de selecionar dados que contêm 20% e

80% dos dados de modelação (𝑖𝑡𝑒𝑟𝑠𝑀𝐴20_80) e dez para 40% e 60%, (𝑖𝑡𝑒𝑟𝑠𝑀𝐴40_60). A necessidade

de seguir este método deve-se ao facto de este trabalho se propor a um estudo da quantidade de

amostras necessárias para a estimação dos parâmetros dos modelos.

2.2.5. Avaliação e Interpretação

Este é o último passo do processo KDD e é crucial para todo o processo de aprendizagem, uma

vez que é através deste processo que se avalia o desempenho dos modelos criados dependendo da

quantidade de dados de treino utilizados. Os modelos de decisão testados neste trabalho são:

Regressão Logística (RL) e modelos fuzzy com sistemas de inferência Takagi-Sugeno (TS) baseados

nos métodos de clustering Gustafson-Kessel (GK) e Fuzzy c-Means (FCM), explicados em pormenor

no capítulo 4.

Para se compreender o cálculo dos índices de desempenho dos modelos é necessário ter em

consideração que para classificar múltiplas classes através de classificadores binários, cada amostra

só pode ter uma classe de cor e textura real. Assim a classificação predita de cada modelo toma

valores lógicos (0 ou 1), no entanto é necessário que a resposta contínua dos classificadores seja

comparada com o threshold definido através dos dados de treino, o que define a fronteira de pertença.

Tendo em conta a combinação das classificações reais (pré classificação) e preditivas (resposta

dos modelos), quatro diferentes possibilidades podem ser consideradas (Tabela 2-4), também

conhecida como matriz de confusão [31].

M2 M3 M4 M5M1

M1 M2 M3 M4 M5

M2 M1 M3 M4 M5

M3 M2M1 M4 M5

M4 M2 M3M1 M5

M5 M2 M3 M4M1

20% 80%

M2M1

M1 M3

M1 M4

M1 M5

M2 M3

M2 M4

M2 M5

M3 M4

M3 M5

M4 M5

40%

M3 M4 M5

M2 M4 M5

M2 M3 M5

M2 M3 M4

M1 M4 M5

M1 M3 M5

M1 M3 M4

M2M1 M5

M2M1 M4

M2 M3M1

60%

Total dos dados (487 Amostras)

Teste

20% 80%

Modelação

=

5 runs

10 runs

17

Tabela 2-4: Possíveis combinações das classificações reais e preditas.

Classe Predita

Positivo Negativo

Classe Real

Positivo True Positive (TP) False Negative (FN)

Negativo False Positive (FP) True Negative (TN)

Esta tabela é preenchida pelas amostras testadas nos modelos treinados e o total de amostras

alocadas em cada possibilidade de classificação tem de ser igual à quantidade de amostras testadas.

Assim pode definir-se que TP corresponde às amostras que foram bem classificadas na classe

positiva, FP às amostras que foram mal classificadas na classe positiva, FN às amostras que foram

mal classificadas como classe negativa e TN às amostras que foram bem classificadas na classe

negativa.

O cálculo dos índices de desempenho é realizado com base na divisão realizada através da matriz

de confusão e são considerados os seguintes índices de desempenho:

Sensitivity, ou true positive rate (TPR), mede a quantidade de amostras positivas que

foram corretamente classificadas:

𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 = 𝑇𝑃𝑅 =𝑇𝑃

𝑇𝑃+𝐹𝑁 (2.1)

Specificity (SPC), ou true negative rate, mede a quantidade de amostras negativas que

foram corretamente classificadas:

𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦 = 𝑆𝑃𝐶 =𝑇𝑁

𝑇𝑁+𝐹𝑃 (2.2)

Fall-out, ou false positive rate (FPR), mede a quantidade de amostras positivas que foram

incorretamente classificadas:

𝐹𝑃𝑅 = 1 − 𝑆𝑃𝐶 (2.3)

Accuracy (ACC) mede a proporção de classificações corretas sobre o total de

observações:

𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝐴𝐶𝐶 =𝑇𝑁+𝑇𝑃

𝑇𝑁+𝑇𝑃+𝐹𝑃+𝐹𝑁 (2.4)

Com as medidas de desempenho introduzidas é possível representar a receiver-operating

characteristic (ROC) que possibilita a obtenção de um novo índice, designado de area under the ROC

curve (AUC) [32], muito utilizado para avaliar classificadores em diversos problemas [33, 34, 35]. A

curva ROC é traçada com os valores obtidos de TPR (2.1) na abcissa e FPR (2.3) na ordenada,

variando o threshold de pertence entre 0 e 1, Figura 2-6.

18

Figura 2-6: Representação das diferentes curvas ROC.

O índice AUC é calculado pela integração da curva ROC para todos os thresholds, conseguindo

obter valores entre 0 e 1 para este índice, em que entre 0 e 0,5 sugere-se que se altere as classes

porque apresenta melhores resultados para o problema inverso, 0,5 é corresponde a um modelo sem

valor e 1 corresponde a um modelo ideal, impossível de se obter em problemas reais. Este índice de

desempenho é útil quando se está a lidar com problemas onde se torna difícil a especificação do

threshold de pertença.

Como o problema que se trata neste trabalho necessita que os modelos consigam prever com

bom desempenho as amostras positivas ou negativas, verificou-se a necessidade de criar um critério

de desempenho ponderado (CDP) em que os índices de TPR e SPC serão conjugados (equação 2.5).

Existe uma elevada preocupação em criar lotes de mármores homogéneos, ou seja, as amostras

positivas serem classificadas corretamente (TPR) e as amostras que foram corretamente

classificadas como negativas (SPC) são os fatores mais importantes devido ao custo real associado

destas mesmas decisões. No entanto, o custo ao classificar amostras positivas incorretamente é um

fator a considerar, como tal os índices de ponderação de TPR e SPC não podem ser muito

discrepantes.

𝐶𝑟𝑖𝑡é𝑟𝑖𝑜 𝑑𝑒 𝐷𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜 = 𝐶𝐷𝑃 = 0,6𝑇𝑃𝑅 + 0,4𝑆𝑃𝐶 (2.5)

Assim torna-se possível avaliar os modelos através deste critério de desempenho que vai ao

encontro dos custos de seleção reais, e assim tomar decisões quanto à estimação dos parâmetros

dos modelos.

Modelo Ideal Modelo Real Modelo Sem Valor

19

Processamento de Imagem

Uma imagem é representada em termos computacionais como um array, ou matriz, composta por

pixéis quadrados dispostos em linhas e colunas. Uma imagem de “cor verdadeira” tem uma

intensidade de cor de 24 bits, o que equivale a 3 componentes, RGB (red, green e blue), com 8 bits

cada elemento e podem obter valores entre 0 e 256, logo cada imagem poderá representar cerca de

16,7 milhões de cores [36]. As amostras utilizadas neste trabalho foram digitalizadas pelo protótipo

StoneScan da empresa FrontWave sempre com a mesma calibração de cores para não haver

discrepâncias significativas. Esta digitalização resulta num conjunto de ficheiros TIFF (Tagged Image

File Format), formato padrão para imagens com 24 bits de intensidade de cor.

As imagens a processar são divididas num conjunto de células discretas pequenas, conhecidas

como pixéis. Cada píxel tem uma forma quadrangular e a quantidade de pixéis existentes na imagem

é o que define as suas dimensões digitais. Posteriormente à divisão obtém-se uma matriz em que

cada célula é definida por uma só cor, ou seja, qualquer variação de cor da imagem real nessa

pequena área é perdida. Se a área de cada píxel for muito pequena, então para um humano tornasse

invisível esta divisão. Este conjunto de células irá constituir uma matriz 3D no espaço de cores, sendo

que cada píxel contem informação das três componentes da imagem real em formato digital em

termos de intensidade de cor RGB.

Neste capítulo será descrito todo o processo de digitalização e pré processamento das imagens

dos mármores e serão apresentados os atributos, descritores das imagens, extraídos para a

classificação pretendida. O método considerado para a extração desses descritores será descrito em

pormenor uma vez que validará a informação retirada das amostras. Finalmente serão enumerados

os descritores que irão construir os atributos na base de dados tal como a normalização efetuada.

3.1. Tratamento das amostras

As amostras digitalizadas foram analisadas e na sua maioria observa-se que não contêm apenas

a informação da pedra, sendo possível identificar nas margens da imagem parte do tapete rolante

onde se encontram depositadas as lajes para digitalização. Este “defeito” na imagem sucede-se

devido a problemas de calibração do corte da imagem digitalizada. Foi então necessário melhorar o

corte das imagens e normalizar as dimensões de forma a obter-se um número igual de pixéis para

todas as imagens.

Para realizar o pré-processamento referido construiu-se um algoritmo em Matlab em que se

recorre a distinção entre os pretos do tapete e a cor das pedras, no entanto foi necessário proceder-

se a uma transformação dos sistema de cores RGB para HSV [37], formado pelas componentes Hue,

Saturation e Value. Este sistema de cores define o espaço de cor através de H ou tonalidade que

verifica o tipo de cor, abrangendo todas as cores do espectro, S ou saturação que verifica o tom de

cinza da imagem, e V ou brilho que define o grau de claridade da cor.

Este algoritmo calcula a média do brilho para cada conjunto de pixéis referentes às primeiras e

ultimas 50 linhas e colunas, o que garante somente a análise das fronteiras do mármore que poderão

20

ser necessárias eliminar. Foi necessário fixar um limite da média e com diversos testes observou-se

que se a média de V for menor que 0,4 é porque se refere a informação do tapete que terá de ser

eliminada. Contudo ainda é necessário normalizar as dimensões das amostras para que todas

contenham a mesma quantidade de pixéis, dado que as imagens originais têm dimensões que podem

variar entre 980x980, dependendo da qualidade da digitalização. Como as amostras são quadradas

sugeriu-se verificar qual das dimensões da imagem digitalizada é menor para eliminar pixéis dos

limites da outra dimensão para que a imagem digital corresponda à amostra real e não perca nenhuma

informação relevante.

Uma vez que não existe necessidade de processar imagens com uma dimensão elevada, até

porque o tempo computacional é mais elevado, recorreu-se a um redimensionamento baseado na

interpolação bicúbica para regiões de 4x4 pixéis [38]. Este método faz com que os pixéis da nova

imagem contenham um conteúdo visual semelhante à original porque se realiza uma transição suave

entre as cores do primeiro plano e do plano de fundo. Esta interpolação calcula uma média ponderada

entre cada píxel e os seus vizinhos nas três direções (horizontal, vertical e diagonal) e preenche um

novo píxel entre eles no caso de ampliação da imagem original. Neste caso o objetivo será o de

reduzir as dimensões das imagens e como tal os pixéis que foram eliminados serão substituídos por

novos, da mesma forma que no caso de ampliação. Assim é possível reduzir as amostras iniciais para

uma dimensão na base logarítmica de dois, 2n, sendo n=9 (512x512) as dimensões adequadas às

imagens de trabalho. A Figura 3-1 apresenta os resultados das etapas descritas para uma amostra

típica de dimensão original de 985x983.

Imagem Inicial

Transformação HSV

Corte da Imagem

Redimensionamento para 2n

Figura 3-1: Pré processamento das amostras para n=9.

21

O resultado obtido deste pré processamento não altera a informação dos mármores digitalizados

em termos de cores e texturas. As amostras ficam assim redimensionadas e normalizadas para uma

nova dimensão, formando um quadrado perfeito, com um total de 262144 pixéis.

3.2. Métodos de obtenção de descritores

Existe a necessidade de caracterizar de forma quantitativa um objeto numa imagem sendo que,

para tal, as características de imagem – cor e textura – são representadas por um vetor de escalares,

designado de descritor de imagem. Esse descritor corresponde a um ponto no espaço Rn. É dada

grande importância a que todos os descritores sejam invariantes a transformações. No entanto, a

complexidade destes descritores, ou assinaturas como às vezes são chamados, implica que possam

ser necessárias funções mais complexas de distância do que uma simples métrica Euclideana para

se poder efetuar comparações de qualidade. Existem descritores de alto nível e de baixo nível. Os

descritores de alto nível representam de uma forma mais abstrata as características das imagens

globais e os descritores de baixo nível representam informações mais específicas e referentes a

regiões ou até mesmo a pixéis da imagem.

Nas últimas duas década desenvolveram-se novas formas para obter descritores que se baseiam

em pontos de interesse das imagens como os métodos scale invariante feature transform (SIFT) e

speeded-up robust features (SURF). Estes dois métodos baseiam-se na orientação do gradiente de

imagem, diferindo apenas na deteção dos pontos de interesse e são métodos invariantes à escala,

translação e rotação da imagem [39, 40, 41]. Possuem um grande potencial para problemas como

reconhecimento facial, biometria e reconhecimento de padrões. Existem também métodos binários,

como o binary robust invariant and elementary feature (BRIEF) e binary robust invariant scalable key

points (BRISK) que através de funções de comparação de intensidade de pixéis, criam vetores

binários para criar regiões ou pontos de interesse [42, 43].

Uma vez que neste trabalho se analisa e classifica os diferentes tipos de mármores existentes

numa fábrica de acordo com a sua cor e textura e a sua digitalização é feita com as condições de

luminosidade e translação constantes, não se considerou necessário aplicar estes métodos mais

recentes que utilizam pontos de interesse. Existem métodos de segmentação de imagem em que o

critério de divisão pode ser definido por homogeneidade ou variação de cor, sendo possível ter

descritores das regiões resultantes. Assim considerou-se a segmentação QuadTree tal como feito

num trabalho anterior [12] e será apresentada na secção 3.3 deste capítulo. Descritores de frequência

ou regiões de cores predominantes são muito importantes devido ao fator humano que usa a cor

como forma de categorização. Deste modo estes métodos de segmentação da imagem são bastantes

utilizados quando se trata de imagens naturais, dado que a decomposição tem em conta a variação

de cor.

3.2.1. Descritores de cor

A cor é a primeira característica visual que se considera para CBIR porque é o fator mais

importante na perceção visual humana. A cor é uma perceção visual da reflexão das ondas de

22

frequência eletromagnética nos objetos e está relacionada com os diferentes comprimentos de onda

do espectro. O ser humano só consegue ver uma pequena faixa do espectro de frequências,

designado de faixa visível, contida entre 370𝑛𝑚 (violeta) e 750𝑛𝑚 (vermelho) do espectro

eletromagnético [44]. Em termos computacionais, é possível representar esta sensação de cor através

de diversos sistemas de cor digitais e é necessário ter em consideração qual o que melhor se adequa

à realidade. De seguida são enumerados alguns espaços de cor em que as imagens originais poderão

ser transformadas para uma melhor perceção da sensação de “cor verdadeira” [45]:

RGB representação das cores vermelho, verde e azul;

HSV representação da tonalidade, saturação e brilho das cores;

CMY representação das cores ciano, magenta e amarelo;

CMYK representação das cores ciano, magenta, amarelo e preto;

No caso da classificação de pedras naturais verificou-se que os espaços de cor que melhor

caracterizam as imagens são o RGB, cores reais, e o HSV, perceção dessas mesmas cores [46]. Os

atributos de cor mais utilizados no método CBIR são os momentos, histogramas e vetores de

coerência de cor [47].

Existem 3 momentos de cor que podem ser calculados para cada elemento no espaço de cor

utilizada, como por exemplo o espaço RGB contem 3 canais diferentes de cor. De seguida são

apresentados os diferentes momentos de cor a calcular:

Média: µ𝑤 =1

𝑁𝑝 . ∑ ∑ 𝑝𝑤,𝑖𝑗

𝑗𝑗=1

𝑖𝑖=1 (3.1)

Desvio padrão: 𝜎𝑤 = √(1

𝑁𝑝 . ∑ ∑ (𝑝𝑤,𝑖𝑗 − µ𝑤)

2𝑗𝑗=1

𝑖𝑖=1 ) (3.2)

Assimetria: 𝑠𝑤 = √(1

𝑁𝑝 . ∑ ∑ (𝑝𝑤,𝑖𝑗 − µ𝑤)

3𝑗𝑗=1

𝑖𝑖=1 )

3 (3.3)

sendo que 𝑁𝑝 é o número de pixéis da imagem e 𝑝𝑤,𝑖𝑗 o valor do píxel na linha 𝑖 e coluna 𝑗 da imagem

na dimensão 𝑤 de cor.

Um histograma de cor representa a distribuição das cores de que uma imagem se compõe e

podem retirar-se diversas informações que poderão ser parâmetros distintivos dos diferentes tipos de

mármores a classificar. É possível perceber qual é a distribuição de cores na imagem global, no

entanto não contêm qualquer tipo de informação da localização dos pixéis com determinadas

características. Como tal existe um descritor que pode ser calculado, que introduz a noção espacial

desses pixéis, o vetor de coerência [48]. Para cada cor existente na imagem haverá um valor que diz

se a cor é coerente ou não, caracterizado por manchas de pixéis iguais. Este valor compõe um novo

vetor onde se tem a informação de quais as cores que mais se notam na imagem através da

proximidade desses mesmos pixéis.

3.2.2. Descritores de textura

Quando se refere a textura um dos conceitos diretamente relacionado é o conceito de

homogeneidade, pois a ideia de textura tem em consideração a variação de cores e as suas

23

transições. Quando se trata de diferenciar pedras naturais este fator torna-se ainda mais importante

na medida em que permite ter uma ideia do nível de grão da pedra. Os descritores de textura ao

serem considerados disponibilizam informação de regularidade, suavidade e rugosidade das pedras.

O método mais usado para a obtenção deste tipo de descritores baseia-se no gray level co-

occurence matrix (GLCM) [49] que se caracteriza como sendo uma matriz de ocorrências de

combinações diferentes de valores de pixéis de brilho (tons cinza ou gray level) que ocorrem numa

imagem. Este método foi inicialmente apresentado por Haralick em 1973 e como tal denomina-se de

descritores de Haralick [50]. Assim é possivel enumerar algum dos descritores que são calculados

através deste método:

Contraste: ∑ 𝑃𝑖,𝑗. (𝑖 − 𝑗)2𝑁𝑝−1𝑖,𝑗=0 (3.4)

Dissemelhança: ∑ 𝑃𝑖,𝑗. |𝑖 − 𝑗|𝑁𝑝−1𝑖,𝑗=0 (3.5)

Homogeneidade: ∑𝑃𝑖,𝑗

1+(𝑖+𝑗)2

𝑁𝑝−1𝑖,𝑗=0 (3.6)

Energia: √∑ 𝑃𝑖,𝑗2𝑁𝑝−1

𝑖,𝑗=0 (3.7)

Entropia: ∑ 𝑃𝑖,𝑗. (− ln 𝑃𝑖,𝑗)𝑁𝑝−1𝑖,𝑗=0 (3.8)

em que 𝑃𝑖,𝑗 é o valor normalizado da GLCM da linha i e coluna j da imagem.

Em termos estatísticos podem definir-se mínimos, máximos, médias e desvios padrões da GLCM,

que também poderão pertencer à família de descritores de textura. Para criar a matriz de co-

ocorrência é necessário ter em atenção diversos parâmetros como por exemplo a direção em que

procura as combinações de pixéis, o tamanho das regiões dessas mesmas combinações e até mesmo

a gama dos níveis de cinzento a considerar. Como tal este método não é o mais aconselhado para

um descritor de textura global que se possa considerar para todos os tipos de mármores.

3.3. Segmentação QuadTree

A segmentação QuadTree [51, 52] é utilizada para decompor uma imagem não homogénea em

regiões, e necessita que a amostra de entrada tenha dimensões quadráticas na base logarítmica de

dois, 2n, sendo n um número inteiro positivo. Esta condição já foi satisfeita com o pré processamento

das imagens, introduzida na seção 3.1 deste documento, em que as dimensões foram normalizadas

para 512x512 pixéis.

3.3.1. Objetivos e metodologia do algoritmo

O objetivo da segmentação de texturas é dividir a imagem em regiões homogêneas de acordo com

a informação de textura presente em cada uma. O principal obstáculo de implementação deste

método é a necessidade de escolha de um conjunto de características e medidas para descrever e

diferenciar as regiões. Um conjunto com poucas características pode não diferenciar texturas

parecidas de forma satisfatória e, por outro lado, características demais podem fazer com que texturas

24

visualmente parecidas sejam consideradas como texturas diferentes, causando sobre segmentação

na imagem. Uma vez que neste trabalho só se tratam amostras de pedras de mármore polidas

considerou-se como critério de decomposição de regiões o desvio padrão da intensidade de cor.

Como se trata de um algoritmo do tipo split-and-merge [49], pode dividir-se em duas partes: a

primeira é responsável por decompor a imagem em regiões de textura homogénea, definindo as

fronteiras dessas mesmas regiões utilizando a decomposição QuadTree. A segunda parte pode ser

vista como um passo de pós-processamento, que procura encontrar semelhanças entre as regiões

descritas e agrupá-las sob uma mesma região.

A decomposição inicializa com uma primeira divisão da imagem em 4 regiões quadradas. As

imagens a processar têm dimensões quadráticas na base logarítmica de 2 e é possível dividir toda a

imagem em regiões quadradas até se obter regiões que contenham somente um píxel. Para evitar a

decomposição da imagem a este extremo, definiu-se como critério de paragem um número mínimo

de pixéis por região igual a 4.

Figura 3-2: Diagrama do processo de decomposição QuadTree com 3 níveis.

Dado que as imagens de entrada têm dimensões quadradas de 29, 512 pixéis, e o critério de

dimensão mínima é de 22, 4 pixéis, é possível chegar a um máximo de oito subdivisões de regiões.

Na Figura 3-2 apresenta-se um esquema com três subdivisões representativas do processo de

decomposição.

Os passos deste algoritmo podem ser descritos da seguinte forma:

1. A imagem de entrada é subdividida em quatro regiões quadradas;

2. Os pixéis de cada bloco são testados em relação ao critério de homogeneidade;

3. Se o critério não é satisfeito, o bloco é novamente subdividido em quatro;

4. Este processo repete-se até que todas as regiões atendam ao critério de homogeneidade

ou ao tamanho mínimo estabelecido. A imagem resultante pode conter regiões de

tamanhos diferentes.

25

Como este processo visa decompor as amostras em diversos blocos, ou regiões, conforme a sua

homogeneidade, foi feita uma transformação do espaço de cores original, RGB, para intensidade, ou

tons de cinzento [36]. Esta transformação preserva toda a informação referente à textura e assim

simplifica-se o processo de segmentação, dado que cada imagem passa a ser representada por uma

dimensão.

O critério de homogeneidade que define a divisão de cada região, 𝑟, foi baseado no desvio padrão

de intensidade.

𝜎𝑟 = √1

𝑁𝑝 ∑ ∑ (𝑥𝑖𝑗 − µ𝑟)

2𝑗𝑗=1

𝑖𝑖=1 (3.9)

em que µ𝑟 = 1

𝑁𝑝∑ ∑ 𝑥𝑖𝑗

𝑗𝑗=1

𝑖𝑖=1 , 𝑁𝑝 = 𝑖 ∗ 𝑗 (dimensão da secção) e 𝑥𝑖𝑗 o valor de cada píxel.

Pode então definir-se uma variável lógica, 𝑑𝑖𝑣𝑅𝑒𝑔, que representa a necessidade de decompor

cada região. A condição que retorna a validade da variável é representada pela equação 3.10 e o

valor 𝑒𝑥𝑝𝑆𝑡𝑑 é o que define o refinamento da segmentação da imagem.

{𝜎𝑟 ≤ 𝑒𝑥𝑝𝑆𝑡𝑑 , 𝑑𝑖𝑣𝑅𝑒𝑔 = 0𝜎𝑟 > 𝑒𝑥𝑝𝑆𝑡𝑑 , 𝑑𝑖𝑣𝑅𝑒𝑔 = 1

(3.10)

em que valor de 𝑒𝑥𝑝𝑆𝑡𝑑 foi variado entre 3, 5 e 7 para se conseguir construir três diferentes conjuntos

de dados de atributos das observações, dado que para cada valor diferente a considerar na condição

de segmentação, obtêm-se regiões diferentes com tempos computacionais associados (Figura 3-3).

Como esta segmentação teve em conta a homogeneidade de cor de cada região, é possível

representar cada região pela média de cor em que não se perderá informação relevante para a

classificação desejada. Este método é muito versátil dado que se conseguem obter diferentes

decomposições da mesma imagem, o que irá corresponder a diferentes valores de descritores a

considerar. É então possível fazer um estudo estatístico para definir o melhor parâmetro de 𝑒𝑥𝑝𝑆𝑡𝑑

que classifica novas imagens com boa precisão, tendo em conta o tempo de segmentação necessário.

Estes três diferentes vetores de atributos compõem diferentes dados para as mesmas observações

e foram designados de 𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 e 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7.

A obtenção dos tempos de processamento apresentados na Figura 3-3 tiveram em conta a

implementação do algoritmo de segmentação na versão de Matlab 2015a e o processamento num

computador as características apresentadas na Tabela 3-1.

Tabela 3-1: Especificações do computador utilizado neste estudo.

Sistema Operativo Windows 8.1, versão 64 bits

Processador Intel(R) Core(TM) i7-4710HQ CPU @ 2.50GHz

Memória Ram 8 GB

26

Figura 3-3: Segmentação da amostra com três diferentes critérios de homogeneidade das regiões e tempos associados a cada uma dessas decomposições.

3.3.2. Características da decomposição

Depois de concluída a segmentação das amostras, é possível saber a quantidade de regiões de

cada amostra, tal como as áreas associadas e o tempo de segmentação. Para definir qual a sensação

de cor que predomina, as quatro maiores áreas foram consideradas como as regiões predominantes

de cada amostra e as venadas presentes na superfície dos mármores são as regiões que apresentam

uma maior diferença na intensidade de cor quando comparadas com as regiões predominantes.

Com a transformação do espaço de cores RGB para HSV, é possível calcular média e desvios

padrões do brilho das cores (componente V) referentes à amostra global, regiões independentes e

área total das regiões predominantes. A condição (3.11) define-se a região 𝑟 é venada e define uma

variável lógica, 𝑟𝑒𝑔𝑉𝑒𝑛.

{|µV[região r] − µV[regiões predominantes]| ≤ σV[global] , regVen = 0

|µV[região r] − µV[regiões predominantes]| > σV[global] , regVen = 1 (3.11)

sendo µ𝑉 e 𝜎𝑉, a média e desvio padrão de V, respetivamente.

Consegue observar-se na Figura 3-4 a) que a condição 3.11 consegue definir as regiões que são

consideradas como venadas mas existe também a necessidade de saber se esses mesmos blocos

são venadas claras ou escuras. Como tal propõe-se neste trabalho uma nova condição que

caracteriza as venadas de acordo com a sua luminosidade. Da mesma forma que as venadas foram

determinadas anteriormente de acordo com (3.11), recorrendo à diferença absoluta das médias, para

diferenciar essas mesmas venadas é necessário considerar o sinal resultante dessa mesma

diferença:

expStd = 3Tempo = 14.80 s



27

{µV[região r] − µV[regiões predominantes] > σV[global] , escura

µV[região r] − µV[regiões predominantes] < −σV[global] , clara (3.12)

Assim todas as venadas anteriormente definidas terão uma nova variável associada, a

luminosidade. Uma vez que existem mármores de diversas cores, a análise referida é importante para

uma nova subclassificação que tem por base a cor das venadas, associadas à textura das mesmas.

Na Figura 3-4 b) pode observar-se uma representação de cores artificiais da distinção realizada para

as venadas.

Em suma, obtém-se informação pormenorizada de cada amostra tal como a quantidade de regiões

que a compõe, áreas associadas, quantidade de venadas claras e escuras, regiões predominantes e

tempo de segmentação para os três critérios de homogeneidade considerados.

a) b)

Figura 3-4: Apresentação das regiões predominantes e das venadas. a) Contorno verde corresponde às regiões predominantes e vermelho às venadas; b) Cores artificiais, verde corresponde às venadas

claras e vermelho às venadas escuras.

3.4. Definição dos atributos das observações

Dado que existe a necessidade de classificar novas amostras nas classes de cor e textura

previamente definidas, diferentes descritores serão especificados para cada classificador. A

dificuldade da escolha dos atributos a retirar é notória devido à quantidade de diferentes descritores

que existem para classificar imagens em conjuntos de cor e textura. Torna-se então necessário fazer

uma restrição dos atributos a considerar para não ter demasiados descritores que poderão piorar os

resultados o que também implica num processo de classificação menos demorado.

3.4.1. Atributos de cor considerados

Desta decomposição definiram-se as áreas predominantes que se caracterizam como sendo as

mais relevantes no que diz respeito à perceção da cor do mármore. Tal como os especialistas

classificam, a classe de cor da pedra é definida pelas cores predominantes, ou seja, as quatro maiores

regiões encontradas depois da segmentação. Considerou-se assim um grupo de descritores de cor

através de médias e desvios padrão no espaço de cores RGB e HSV:

28

µ𝑅𝐺𝐵 𝑝𝑟𝑒𝑑 =1

𝑅𝑝. ∑ µ𝑟[𝑅𝐺𝐵]

𝑅𝑝𝑟=1 (3.13)

𝜎𝑅𝐺𝐵 𝑝𝑟𝑒𝑑 =1

𝑅𝑝. ∑ 𝜎𝑟[𝑅𝐺𝐵]

𝑅𝑝𝑟=1 (3.14)

µ𝐻𝑆𝑉 𝑝𝑟𝑒𝑑 =1

𝑅𝑝. ∑ µ𝑟[𝐻𝑆𝑉]

𝑅𝑝𝑟=1 (3.15)

𝜎𝐻𝑆𝑉 𝑝𝑟𝑒𝑑 =1

𝑅𝑝. ∑ 𝜎𝑟[𝐻𝑆𝑉]

𝑅𝑝𝑟=1 (3.16)

sendo que 𝑅𝑝 é o número de regiões predominantes e cada um destes descritores contêm três

componentes distintas.

Para além da informação das áreas predominantes é necessário caracterizar a cor na imagem

global e procede-se de forma semelhante à exposta anteriormente em que se calcula a média e desvio

padrão para o espaço de cores RGB e HSV como descrito nas equações 3.1 e 3.2, respetivamente.

Assim já se tem a perceção de cor da imagem global e das áreas predominantes, constituindo um

total de 24 descritores.

Figura 3-5: Histograma dos tons de cinzentos da imagem global.

Em relação à sensação de brilho das cores que constituem a imagem, recorreu-se ao histograma

dos tons de cinzentos da imagem global, Figura 3-5. O valor de cinzentos com mais ocorrências de

pixéis na imagem representa um novo atributo.

Assim resulta um vetor com 25 descritores de cor a considerar, em que 13 desses descritores são

obtidos da imagem global e os restantes necessitam de ser calculados a partir da segmentação

QuadTree obtida.

Nú

mer

o d

e o

corr

ênci

as

Valores de tons de cinzentos

29

3.4.2. Atributos de textura considerados

A homogeneidade da imagem ou textura está diretamente relacionada com a quantidade de

regiões que o algoritmo de segmentação QuadTree decompõe (𝑁𝑟𝑒𝑔𝑖õ𝑒𝑠) uma vez que o critério de

divisão dessas mesmas regiões têm em conta um valor mínimo do desvio padrão da componente de

luminosidade de cores. Como a perceção de textura se relaciona com a variação de luminosidade,

utilizaram-se informações obtidas através da segmentação para calcular estes descritores.

Dado que a segmentação inicializa com uma divisão da imagem de entrada em quatro regiões

iguais (𝑓𝑖𝑟𝑠𝑡𝑆𝑒𝑔), um mármore é totalmente homogéneo se só for decomposto nessas mesmas

regiões. Quanto maior for a decomposição da amostra, menos homogéneo é o mármore:

𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑𝑒 = 1 −𝑚𝑖𝑛𝐴𝑟𝑒𝑎.(∑(𝑁𝑟𝑒𝑔𝑖õ𝑒𝑠)−𝑓𝑖𝑟𝑠𝑡𝑆𝑒𝑔)

Á𝑟𝑒𝑎 𝑡𝑜𝑡𝑎𝑙 𝑑𝑎 𝑖𝑚𝑎𝑔𝑒𝑚 (3.17)

sendo que 𝑚𝑖𝑛𝐴𝑟𝑒𝑎 é a condição de paragem do critério de segmentação, a área mínima por região

é definida como sendo igual a 4 pixéis. A área total da imagem é a quantidade de pixéis que cada

imagem contém, neste trabalho só se trataram de imagem quadradas com um total de 263680 pixéis.

O descritor denominado de homogeneidade assume valores entre 0 e 1, sendo que 0 corresponde a

um mármore nada homogéneo e 1 muito homogéneo.

Apesar deste descritor ser capaz de caracterizar qualquer mármore em termos de

homogeneidade, a perceção de textura de uma pedra natural tem em conta as grandes variações de

cor, definidas como venadas. Como tal surge a necessidade de quantificar o grau de percetibilidade

dessas mesmas venadas existentes na pedra, sendo elas claras ou escuras. Para todas as regiões

que foram consideradas venadas, calculou-se a média do brilho, gerando duas novas variáveis:

𝑣𝑎𝑟𝑉𝑐𝑙𝑎𝑟𝑜 e 𝑣𝑎𝑟𝑉𝑒𝑠𝑐𝑢𝑟𝑜, correspondentemente às venadas claras e escuras.

Como a quantidade de venadas claras e escuras não está diretamente correlacionada, o grau de

percetibilidade da cor das venadas, 𝑣𝑎𝑟𝑉𝑒𝑛𝑎𝑑𝑎𝑠, pode ser calculado da seguinte forma:

𝑣𝑎𝑟𝑉𝑒𝑛𝑎𝑑𝑎𝑠 = 𝑣𝑎𝑟𝑉𝑐𝑙𝑎𝑟𝑜.𝑝𝑉𝑒𝑛𝐶𝑙𝑎𝑟𝑜

𝑝𝑉𝑒𝑛+ 𝑣𝑎𝑟𝑉𝑒𝑠𝑐𝑢𝑟𝑜.

𝑝𝑉𝑒𝑛𝐸𝑠𝑐𝑢𝑟𝑜

𝑝𝑉𝑒𝑛 (3.18)

sendo que 𝑝𝑉𝑒𝑛 é a percentagem de todas as venadas, 𝑝𝑉𝑒𝑛𝐶𝑙𝑎𝑟𝑜 e 𝑝𝑉𝑒𝑛𝐸𝑠𝑐𝑢𝑟𝑜 a percentagem das

venadas claras e escuras, respetivamente. Define-se assim frações diferentes para as venadas

distintas.

Na secção 3.2.2 foram descritos diferentes descritores que podem ser calculados para a

caracterização de texturas através do GLMC. Como se recorre à segmentação QuadTree não se

verifica a necessidade de utilizar esses descritores, no entanto o descritor de entropia apresentado

na equação 3.8 foi calculado para a imagem global, fazendo parte do universo de descritores de

textura a considerar.

Em suma, o vetor de atributos referente à textura é composto por três descritores completamente

distintos, independentes e invariantes à escala e rotação da amostra, em que só um é calculado

diretamente da imagem global e os restantes dependem da segmentação QuadTree.

30

3.4.3. Normalização dos vetores de atributos

É necessário fazer uma normalização dos dados com o objetivo de evitar gamas de valores

diferentes. A normalização é realizada recorrendo ao método de normalização mínimo-máximo. Para

o total das 487 amostras disponíveis foi necessário verificar os valores máximos e mínimos de cada

atributo, representados por 𝑥𝑘𝑚𝑖𝑛 e 𝑥𝑘𝑚𝑎𝑥 , respetivamente. Para cada amostra 𝑛 e descritor 𝑘 o valor

normalizado, 𝑥𝑛,𝑘𝑛𝑜𝑟𝑚 , é obtido dos valores reais 𝑥𝑛,𝑘, através da seguinte equação:

𝑥𝑛,𝑘𝑛𝑜𝑟𝑚=

𝑥𝑛,𝑘−𝑥𝑘𝑚𝑖𝑛

𝑥𝑘𝑚𝑎𝑥−𝑥𝑘𝑚𝑖𝑛

(3.19)

Na Tabela 3-2 são apresentados todos os atributos considerados neste trabalho e os valores

máximos e mínimos para cada conjunto de descritores calculados das diferentes decomposições

consideradas.

Tabela 3-2: Descritores considerados neste trabalho e valores máximos e mínimos de todas as observações para cada critério de decomposição considerado na segmentação QuadTree.

Nº Designação do descritor

RawData3 RawData5 RawData7

Min Max Min Max Min Max

1 µR das áreas predominantes 123,02 206,91 106,51 205,93 121,64 206,59

2 µG das áreas predominantes 121,33 197,10 105,68 197,10 113,29 197,98

3 µB das áreas predominantes 94,96 177,64 90,41 177,60 85,19 178,27

4 σR das áreas predominantes 1,88 3,86 2,16 5,61 3,33 7,28

5 σG das áreas predominantes 1,90 3,16 2,44 5,28 3,22 7,35

6 σB das áreas predominantes 2,06 3,85 2,80 6,39 3,15 7,82

7 µH das áreas predominantes 0,08 0,14 0,08 0,15 0,07 0,14

8 µS das áreas predominantes 0,06 0,39 0,05 0,41 0,06 0,42

9 µV das áreas predominantes 0,48 0,81 0,42 0,81 0,48 0,81

10 σH das áreas predominantes 0,00 0,02 0,00 0,03 0,00 0,02

11 σS das áreas predominantes 0,01 0,03 0,01 0,03 0,01 0,04

12 σV das áreas predominantes 0,01 0,02 0,01 0,02 0,01 0,03

13 µR da imagem global 92,80 202,89 92,80 202,89 92,80 202,89

14 µG da imagem global 92,20 195,63 92,20 195,63 92,20 195,63

15 µB da imagem global 88,45 176,53 88,45 176,53 88,45 176,53

31

16 σR da imagem global 6,43 28,56 6,43 28,56 6,43 28,56

17 σG da imagem global 5,97 31,78 5,97 31,78 5,97 31,78

18 σB da imagem global 5,29 33,47 5,29 33,47 5,29 33,47

19 µH da imagem global 0,07 0,17 0,07 0,17 0,07 0,17

20 µS da imagem global 0,05 0,39 0,05 0,39 0,05 0,39

21 µV da imagem global 0,36 0,80 0,36 0,80 0,36 0,80

22 σH da imagem global 0,00 0,08 0,00 0,08 0,00 0,08

23 σS da imagem global 0,01 0,09 0,01 0,09 0,01 0,09

24 σV da imagem global 0,03 0,11 0,03 0,11 0,03 0,11

25 Valor de cinzentos com mais

ocorrências 90,00 198,00 90,00 198,00 90,00 198,00

26 Homogeneidade 0,77 0,98 0,80 1,00 0,83 1,00

27 Entropia 4,47 6,63 4,47 6,63 4,47 6,63

28 Percetibilidade das venadas 0,04 0,25 0,04 0,27 0,00 0,29

32

33

Modelos de Decisão

Uma vez obtidos os descritores das imagens digitais dos mármores, é necessário criar um sistema

automático que consiga classificar os diferentes tipos de mármore em termos de cor e textura. O

modelo de decisão baseado em regressão logística (RL) é muito utilizado para modelos de predição

binária e como tal foi considerado neste trabalho e é explicado neste capítulo. No entanto, também

se consideraram modelos fuzzy baseados em sistemas de inferência Takagi-Sugeno (TS). As duas

técnicas de clustering utilizadas para definir os antecedentes são baseadas no algoritmo Gustafson

Kessel (GF) e Fuzzy C-Means (FCM), são explicadas em detalhe. Por fim, a classificação de múltiplas

classes através de classificadores binários e os critérios de decisão para classificação final dos

mármores são explicados.

4.1. Regressão Logística

Os modelos de regressão constituem uma das ferramentas mais importante na análise estatística

de dados, sendo o seu principal objetivo explorar a relação entre uma ou mais variáveis explicativas

ou independentes, e uma variável resposta ou dependente [53]. RL é um caso particular das

regressões lineares onde a variável resposta apresenta apenas duas categorias, ou de alguma forma,

dividida em duas categorias assumindo valores 0 ou 1. Esta é uma técnica que tem como objetivo

modelar, a partir de um conjunto de observações, a relação dita logística entre a variável de resposta

binária e uma série de variáveis explicativas numéricas e/ou categóricas [53].

A essência do modelo RL assenta em modelar a probabilidade de que a resposta tome um destes

dois valores, em vez de prever os valores reais como os modelos de regressão linear. Em qualquer

regressão, a quantidade chave é o valor médio da variável de resposta dado o valor da variável

independente. Esta quantidade é denominada de valor médio condicional e é expressa como

𝐸[𝑌𝑛 | 𝑋𝑛], onde 𝑌𝑛 representa a variável de resposta para 𝑛 , observação a considerar 𝑛 = 1: 𝑁𝑎,

sendo 𝑁𝑎 o número de amostras, e 𝑋𝑛 a variável explicativa, vetor de atributos 𝑘-dimensional em que

𝑘 é o número de atributos [54]. A quantidade 𝐸[𝑌𝑛 | 𝑋𝑛 = 𝑥𝑘,𝑛] é lida como “valor esperado de 𝑌𝑛 dado

𝑋𝑛 = 𝑥𝑘,𝑛”. Admite-se que o valor médio condicional pode ser expresso como uma equação linear em

𝑥𝑛, em que 𝐸[𝑌𝑛 | 𝑋𝑛 = 𝑥𝑘,𝑛] pode assumir qualquer valor real e como tal se introduz 𝜋𝑛 como uma

variável simplificativa que representa a probabilidade de êxito para os valores do vetor de atributos,

𝑥𝑘,𝑛.

A relação entre 𝜋𝑛 e 𝑋𝑛 pode ser representada por uma função de resposta logística (logistic

response function) [54], apresentada na Figura 4-1, e pode ser obtida através da reprodução do

modelo de probabilidades através da equação 4.1, onde as probabilidades foram modeladas pela

função de distribuição (função de probabilidade cumulativa) da RL.

𝜋𝑛 = 𝐸[𝑌𝑛 = 1 | 𝑋𝑛 = 𝑥𝑘,𝑛] =𝑒𝛽0+𝛽1𝑥1,𝑛+𝛽2𝑥2,𝑛+⋯+𝛽𝑘𝑥𝑘,𝑛

1+𝑒𝛽0+𝛽1𝑥1,𝑛+𝛽2𝑥2,𝑛+⋯+𝛽𝑘𝑥𝑘,𝑛 (4.1)

34

onde 𝛽𝑘 são os parâmetros de cada atributo a descobrir da RL e e apresenta a base do logaritmo

natural.

Figura 4-1: Resposta da função da regressão logística [54].

Pode-se denominar a equação 4.1 de função de regressão logística (logistic regression function),

função não linear relativamente aos parâmetros 𝛽0, 𝛽1, 𝛽2, … 𝛽𝑘. No entanto, poderá ser linearizada

através da utilização da transformação logit [55] resultando de um valor transformado de 𝜋𝑛,

introduzindo 𝜋𝑛

1−𝜋𝑛 como a odds ratio de um evento (equação 4.3).

1 − 𝜋𝑛 = 𝐸[𝑌𝑛 = 0 | 𝑋𝑛 = 𝑥𝑘,𝑛] =1

1+𝑒𝛽0+𝛽1𝑥1,𝑛+𝛽2𝑥2,𝑛+⋯+𝛽𝑘𝑥𝑘,𝑛 (4.2)

𝜋𝑛

1−𝜋𝑛= 𝑒𝛽0+𝛽1𝑥1,𝑛+𝛽2𝑥2,𝑛+⋯+𝛽𝑘𝑥𝑘,𝑛 (4.3)

É possível, então, obter-se o logit através do logaritmo natural das odds ratio a ambos os lados da

equação 4.3, de acordo com a seguinte equação:

𝑓𝑛(𝑥1, … , 𝑥𝑘) = ln (𝜋𝑛

1−𝜋𝑛) = 𝛽0 + 𝛽1𝑥1,𝑛 + 𝛽2𝑥2,𝑛 + ⋯ + 𝛽𝑘𝑥𝑘,𝑛 (4.4)

Esta transformação já permite obter uma função linear dos parâmetros 𝛽0, 𝛽1, 𝛽2, … 𝛽𝑘, e assim é

possível criar um modelo que permita a predição de novas amostras.

4.2. Modelos Fuzzy

A maioria dos problemas da vida real não se podem resolver com a abordagem tradicional

desenvolvida pelo filósofo grego Aristóteles, onde o domínio é mapeado exclusivamente com

variáveis de dois estados, verdadeiro ou falso. É muitas vezes necessário introduzir um certo grau de

certeza à semelhança do raciocínio humano de senso comum. O significado da palavra de origem

inglesa “fuzzy” significa incerto, vago, impreciso, subjetivo ou difuso, e como tal, a lógica fuzzy vai

além do raciocínio booleano, baseando-se em aproximações de incertezas e suposições para tomar

decisões.

35

Esses algoritmos são amplamente utilizados atualmente em diversas áreas como: robótica,

automação de linhas de produção, simulações financeiras, previsão de readmissão de doentes ou até

mesmo classificação de objetos. Considerando os problemas reais nas indústrias, no comércio ou

mesmo no dia-a-dia das pessoas, fica claro a ausência de certezas absolutas quanto a algumas

decisões ou afirmações. Como tal a teoria fuzzy deve ser aplicada a estes tipo de problema e para

modelar um sistema fuzzy é necessário introduzir uma explicação teórica da criação dos mesmos. Na

Figura 4-1 apresenta-se um diagrama dos quatro passos essenciais para a sua modelação, interface

de “fuzzificação”, base de conhecimento, motor de inferência e interface de “desfuzzificação” [56].

Figura 4-2: Configuração do sistema fuzzy, adaptado de [56].

Interface de “fuzzificação”: primeiro é necessário determinar o grau de pertença dos

dados de entrada a cada conjunto fuzzy, através de funções de pertençam e de seguida

transformar valores de entrada crisp em graus de pertença, que são usados para associar

um grau a cada termo linguístico.

Base de conhecimento: contém as principais relações entre os dados de entrada e de

saída. O conhecimento é composto por uma base de dados onde são definidas as funções

de filiação para os termos linguísticos e a base das regras a considerar, geralmente

definidas por condições “se-então”.

Motor de inferência: calcula a saída do sistema fuzzy usando a informação contida na

base de regras e nos valores de entrada para produzir uma resposta.

Interface de “desfuzzificação”: responsável por fazer a ligação entre o sistema fuzzy e

a saída. Normalmente converte a saída fuzzy do motor de inferência para uma função

crisp, resultando numa saída binária.

Motor de Inferência

“Fuzzificação” “Desfuzzificação”

Base de Conhecimento

Dados Regras pré-estabelecidas

Se é e … é ,

então

Entradacrisp

Saídacrisp

36

4.2.1. Modelos Fuzzy Takagi-Sugeno

Modelos fuzzy Takagi-Sugeno (TS) consistem em regras fuzzy que traduzem a relação entre os

dados de entrada e saída usando uma lógica fuzzy [57]. Estas regras são tipicamente representadas

da seguinte forma:

𝑅𝑗: 𝑆𝑒 𝑥1 é 𝐴𝑗1 𝑒 … 𝑥𝑛 é 𝐴𝑗𝑛, 𝑒𝑛𝑡ã𝑜 𝑦𝑗 = 𝑓(𝑥1, … , 𝑥𝑘)

em que 𝐴𝑗1 e 𝐴𝑗𝑘 são conjuntos fuzzy no antecedente e 𝑦𝑗 = 𝑓(𝑥1, … , 𝑥𝑘) é uma função crisp

polinomial no consequente onde 𝑗 = 1, … , 𝐽 corresponde ao número da regra em que 𝐽 é o número

total de regras e 𝑥 = (𝑥1, … , 𝑥𝑘) é o vetor de entrada em que 𝑘 é o total de atributos.

Neste trabalho consideraram-se modelos fuzzy TS de primeira ordem [56] em que a função

polinomial no consequente toma a forma de 𝑦𝑗 = 𝑎𝑗𝑇𝑥 + 𝑏𝑗 em que 𝑎𝑗 é um vetor de parâmetros e 𝑏𝑗 é

um offset escalar da regra 𝑗. Assim o grau de ativação, 𝛽𝑗, para a regra 𝑗𝑡ℎ pode ser calculado pela

equação 4.5.

𝛽𝑗 = ∏ µ𝐴𝑗𝑘(𝑥),𝑘

𝑘=1 (4.5)

em que µ𝐴𝑗𝑘(𝑥) ∶ ℝ → [0,1].

A média ponderada das respostas individuais obtidas por cada regra resulta de uma resposta final

determinada pela equação 4.6.

𝑝 =∑ 𝛽𝑗(𝑎𝑗

𝑇𝑥+𝑏𝑗)𝐽𝑗=1

∑ 𝛽𝑗𝐽𝑗=1

(4.6)

Cada classificador terá de tomar valores binários, 𝑝′ 𝜖 {0,1}, em que 0 significa que a amostra de

mármore não pertence à classe, e 1 que pertence. No entanto, como 𝑝 𝜖 [0,1] é necessário

transformar este resultado linear num resultado booleano, aplicando um threshold 𝑡 para cada

classificador.

Na fase de treino dos modelos este threshold foi variado entre 0 e 1, tal que 𝑡 = 0,0.01, … ,1, e

foram obtidos índices de desempenho de TPR e SPC dos modelos. O valor de 𝑡 que atinge o mínimo

absoluto da diferença entre estes dois índices de desempenho, dado que representa o melhor

compromisso entre as taxas de TP e TN, é selecionado para cada classificador.

Assim é possível transformar o resultado linear de 𝑝 num resultado booleano 𝑝′ através da seguinte

comparação:

𝑝′ = {0 , 𝑝 < 𝑡 1 , 𝑝 ≥ 𝑡

(4.7)

4.3. Clustering

O objetivo final do clustering é dividir conjuntos de dados em clusters, ou grupos, distintos de modo

a que os tipos de dados que mais se assemelham fiquem no mesmo grupo [58]. As técnicas de

clustering são métodos de ML não supervisionado em que têm de fazer uma divisão dos dados em

37

diferentes grupos sem nenhuma informação à priori sobre a classe a que cada observação pertence.

Despendendo do tipo de dados utilizados e das características dessas observações, diferentes tipos

de medidas de semelhança podem ser utilizados, como por exemplo, intensidade, conetividade ou

distância.

Existem diversos algoritmos de clustering que podem ser distinguidos globalmente por hard e fuzzy

clustering [58]. No chamado “hard clustering” os dados são divididos pelos diferentes grupos e cada

observação só pode pertencer a apenas um dos grupos. Em “fuzzy clustering”, abordagem utilizada

neste trabalho, cada amostra pode pertencer a mais do que um grupo, sendo que para cada

observação é atribuído um grau de pertença a cada grupo.

Um dos algoritmos mais utilizados para reconhecimento de padrões, processamento de imagem,

data mining e modelação fuzzy são os algoritmos de “fuzzy clustering” [59]. Estes métodos dividem

os dados em conjuntos que se sobrepõem de forma a obter grupos, descrevendo as suas estruturas

subjacentes. Quando se está a lidar com problemas de clustering é necessário ter em conta diversos

parâmetros: o número de agrupamentos, a forma e volume dos mesmos, a inicialização do algoritmo

e a distribuição dos padrões de dados.

4.3.1. Fuzzy C-Means

O algoritmo FCM é o mais utilizado para problemas de fuzzy clustering que se baseia na

minimização de uma função objetivo 𝐽 dada pela equação 4.8 [60].

𝐽𝑚(𝑋, 𝑈, 𝑉) = ∑ ∑ 𝑈𝑔,𝑛𝑚 𝐷𝑔,𝑛(𝑥𝑛, 𝑣𝑔)𝑁𝑎

𝑛=1𝑁𝑔𝑔=1 (4.8)

onde 𝑔 representa o número de agrupamentos, 1 ≤ 𝑔 ≤ 𝑁𝑔 , 𝑁𝑔 é o total de agrupamentos

considerados, 𝑛 representa o número de observações, 1 ≤ 𝑛 ≤ 𝑁𝑎, em que 𝑁𝑎 é o total de amostras,

𝑈 é a matriz de partição fuzzy dada pela equação 4.9 composta por graus de pertença normalizados

𝜇𝑔,𝑛 (equação 4.10), V representa os centros de cada agrupamento 𝑣𝑔 dado a equação 4.13 e, por

fim, 𝐷𝑔,𝑛 é a medida de distância de cada amostra a cada 𝑣𝑔 (equação 4.14).

Para cada amostra 𝑥𝑛, é considerado um grau de pertença ,𝜇𝑔,𝑛 , para cada agrupamento 𝑔, e

assim constituem a matriz de partição 𝑈 [61]:

𝑈 = [

𝜇1,1 ⋯ 𝜇1,𝑁𝑎

⋮ ⋱ ⋮𝜇𝑁𝑔,1 ⋯ 𝜇𝑁𝑔,𝑁𝑎

] (4.9)

Os graus de pertença, 𝜇𝑔,𝑛, podem ser obtidos da seguinte forma:

𝜇𝑔,𝑛 =1

∑ (𝑑𝑛,𝑗

𝑑𝑞,𝑗)

2𝑚−1𝑁𝑔

𝑞=1

(4.10)

em que 𝑚 ∈ [0, ∞] é o peso do expoente que determina o grau de fuzziness dos agrupamentos.

Quanto maior o valor de 𝑚, maior é a sobreposição dos mesmos. Como já se fizeram muitos estudos

38

sobre este parâmetro, adotou-se fixar 𝑚 = 2 de acordo com [62], dado que é o parâmetro que em

geral melhor define as fronteiras dos agrupamentos.

Há que ter em consideração 𝜇𝑔,𝑛 ∈ [0,1], em que zero implica que a amostra 𝑛 não pertence ao

agrupamento 𝑔, e o oposto, um implica que a amostra 𝑛 pertence unicamente ao agrupamento 𝑔.

Pode-se concluir então que a soma de todos os graus de pertence de cada amostra tem de ser igual

a um [61], de acordo com:

∑ 𝜇𝑔,𝑛𝑁𝑔𝑔=1 = 1, ∀𝑔 (4.11)

E o total do grau de pertença de todas as amostras pertencentes a cada cluster tem de ser superior

a zero e menor que o total das amostras [61], dado por:

0 < ∑ 𝜇𝑔,𝑛𝑁𝑎𝑛=1 < 𝑁𝑎, ∀𝑖 (4.12)

Os centros de cada agrupamento são calculados através dos graus de pertença anteriormente

obtidos e são calculados por:

𝑣𝑔 =∑ 𝜇𝑔,𝑛

𝑚 𝑥𝑛𝑁𝑎𝑛=1

∑ 𝜇𝑔,𝑛𝑚𝑁𝑎

𝑛=1 (4.13)

Neste trabalho, para cada amostra é atribuído um grau de pertença a cada agrupamento, que é

proporcional à distância euclidiana entre a amostra e o centro do cluster, pode ser representada por:

𝐷𝑔,𝑛 = 𝑑𝑔,𝑛2 (𝑥𝑛 , 𝑣𝑔) = ‖𝑥𝑛 − 𝑣𝑔‖

2= (𝑥𝑛 − 𝑣𝑔)

𝑇𝐴𝑔(𝑥𝑛 − 𝑣𝑔) (4.14)

em que 𝐴𝑔 é uma matriz simétrica positiva, sendo habitualmente a matriz identidade no algoritmo

FCM [61]. Esta medida de distância euclidiana é adequada para agrupamentos de dados de forma

esférica [63].

4.3.2. Gustafson-Kessel

No caso de os dados constituírem agrupamentos de diferentes formas e orientações, o algoritmo

GK [64] pode ser uma boa alternativa, dado que calcula a distância Mahalanobis [59, 65]. A grande

diferença destes métodos de calcular a distância é a definição da forma dos agrupamentos, tal como

apresentado na Figura 4-3.

Figura 4-3: Diferenças entre distância Euclidiana (rosa) e Mahalanobis (azul), citado de [56].

39

Na equação 4.14, a matriz 𝐴𝑔 passa a ser calculada pela matriz de covariância do agrupamento

𝑃𝑔, através da seguinte equação:

𝐴𝑔 = 𝑃𝑔−1 (4.15)

No cálculo da distância (equação 4.14) é também necessário adicionar uma constante de volume,

|𝐴𝑔| = 𝜌𝑔. No entanto, toda a metodologia do algoritmo GK é idêntica à utilizada no algoritmo FCM

em que a função objetivo é dada pela equação 4.8, os centros dos agrupamentos são novamente

calculados pela equação 4.13 e os graus de pertença pela equação 4.10. Assim, com a alteração do

cálculo da medida da distância de cada amostra aos centros dos agrupamentos melhora no que diz

respeito aos modelos se adaptarem à possível dispersão dos dados.

4.4. Múltiplos Classificadores

Este trabalho propõe uma solução para a resolução de um problema industrial e verificou-se que

a classificação de pedras de mármore é diferente nas diversas geografias. Uma determinada pedreira

pode extrair pedras de diversas famílias de cor e textura, e, por vezes, pode ser encontrada uma

pedra que não se enquadre em qualquer outra família existente. Torna-se necessário então criar

múltiplos classificadores binários para cada família que se pretende classificar através de graus de

semelhança de cor das novas amostras.

Foram criados seis classificadores para as diferentes famílias de cor e três classificadores para

das diferentes famílias de textura através dos dados considerados com mais amostras

disponibilizadas. No processo de treino dos modelos as diferentes classes de classificação foram

avaliadas independentemente e adotando uma estratégia de OvA de classificação [66],os dados de

entrada nos modelos são compostos por todas as observações em que o vetor de predição, 𝑉𝑝𝐶 (𝑛),

toma valores booleanos verdadeiros para as observações, 𝑛, que foram pré classificadas como

pertencentes dessa mesma classe, 𝐶, e as restantes observações como falsas.

No caso de classificação de cor, cada classificador terá associado um valor diferente de threshold

calculado na fase de treino dos modelos, 𝑡𝐶, em que 𝐶 = [1: 𝑛_𝑐𝑙𝑎𝑠𝑠𝑒𝑠]. Assim, uma nova amostra 𝑛

ao ser processada por um classificador 𝐶, se 𝑝𝐶(𝑛) < 𝑡𝐶 é considerado como não pertencente a essa

classe, 𝑝′𝑐(𝑛) = 0, caso contrario 𝑝′

𝑐(𝑛) = 1. No entanto, uma determinada amostra 𝑛 poderá ser

classificada como pertencente a mais do que uma classe, nesse caso é necessário tomar uma decisão

em qual classe é que essa mesma amostra melhor se enquadra de acordo com 4.16.

𝑆𝑒 ∑ 𝑝′𝑐(𝑛)

𝑛_𝑐𝑙𝑎𝑠𝑠𝑒𝑠

𝐶=1

> 1, 𝑖𝑑(𝑛) = arg𝐶 (𝑝′𝑐(𝑛) = 1)

𝑒𝑛𝑡ã𝑜 𝑃𝑐𝑜𝑟(𝑛) = arg 𝑚𝑎𝑥𝑖𝑑(𝑛)(𝑝𝑖𝑑(𝑛)(𝑛)) (4.16)

em que 𝑃𝑐𝑜𝑟(𝑛) se refere à classe a que a amostra 𝑛 melhor se assemelha e 𝑖𝑑(𝑛) as classes que

inicialmente a amostra foi considerada semelhante. Todavia, existe a possibilidade de

∑ 𝑝′𝑐(𝑛)𝑛_𝑐𝑙𝑎𝑠𝑠𝑒𝑠

𝐶=1 = 0, o que significa que a amostra 𝑛 não se assemelha a nenhuma das classes e

assim será considerada como cor indiferenciada.

40

No caso de classificação de novas amostras em termos de textura, o problema é mais simples

dado que existe a obrigatoriedade de estas serem classificadas nas diferentes texturas, ou

homogeneidades de cor, consideras. Desta forma não é necessário transformar o valor linear 𝑝𝐶(𝑛)

para booleano porque ao verificar o maior valor de 𝑝𝐶(𝑛) para todas as classes 𝐶 consideradas,

resulta de uma valor de 𝑃𝑡𝑒𝑥𝑡(𝑛) que pode ser descrito pela seguinte equação:

𝑃𝑡𝑒𝑥𝑡(𝑛) = arg 𝑚𝑎𝑥𝑐( 𝑝𝐶(𝑛)) (4.17)

Desta forma é possível criar um sistema automático de classificação de 𝐶 classes de cor e textura

para pedras de mármore polidas. Neste trabalho foram modelados diferentes classificadores para as

6 classes de cor e 3 de textura definidas pelos dados disponibilizados, e como tal, na Figura 4-4

apresenta-se um diagrama de classificação para essas mesmas classes com um mármore exemplo

classificado.

Figura 4-4: Diagrama do sistema de classificação de cor e textura.

Dado que este trabalho se foca no estudo estatístico de classificação de múltiplas classes com

diferentes métodos de modelação, com este sistema de classificação torna-se possível avaliar as

classificações de amostras que os modelos nunca tiveram conhecimento, dados de verificação, e

calcular percentagens de erro de classificação ao comparar com a pré classificação efetuada pelos

peritos.

Novas amostras

ED_Art_Deco

ED_Rosa

ED_Trovoada

ED_Pastel

FM_Art_Deco

FM_Sunset

Muito Homogéneo

Pouco Homogéneo

Nada Homogéneo

Classificação Cor

Classificação Textura

Nenhuma

Exemplo de classificação:ED_Art_Deco, Pouco Homogéneo

41

Resultados

De todos mármores digitalizados (545 amostras) foram escolhidas as 6 classes de cor com maior

número de amostras, o que resultou no total de 487 amostras com uma pré classificação realizada

pelos peritos em termos de cor e textura. Foram considerados 25 atributos/descritores das amostras

que caracterizam a cor e 3 atributos/descritores para a textura ou homogeneidade. É assim possível

criar modelos de decisão baseados em ML supervisionado o que permite avaliar a qualidade do treino

dos modelos e as suas classificações para novas amostras. Foram criados três diferentes conjuntos

de descritores (𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 e 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7) dos mármores dado que se consideraram

diferentes critérios de decomposição para o algoritmo QuadTree, o que resultou em diferentes

refinamentos das amostras e diferentes tempos computacionais. Pretende-se posteriormente concluir

qual o melhor parâmetro de segmentação a considerar.

Podem avaliar-se os modelos de decisão através dos seus desempenhos com diferentes dados

de treino e teste pelo melhor resultado do critério de desempenho. Para os diferentes conjuntos de

modelação e verificação dos dados globais com todas as percentagens de treino consideradas, como

apresentado na secção 2.2.4. Uma vez que se trata de um problema de múltiplas classes binárias,

terá de se considerar todas as classes independentemente e definir os melhores parâmetros de

modelação gerais para que estes resultados possam ser reproduzidos com outras amostras.

Com as considerações referidas é possível realizar um estudo estatístico que conclua qual o

melhor modelo a considerar para classificar com precisão os mármores em termos de cor e textura,

recorrendo ao menor número de amostras necessárias para treino. Foram testados três modelos de

decisão:

Regressão Logística;

Modelo Fuzzy com Gustafson Kessel (GK) clustering;

Modelo Fuzzy com Fuzzy C-Means (FCM) clustering.

Neste capítulo são apresentados os resultados obtidos dos múltiplos classificadores de cor e

textura e como se considera um número elevado de variáveis é necessário fazer uma análise faseada

para cada variável de forma a ir fixando parâmetros até encontrar o método de decisão que melhor

classifica os mármores. Serão apresentados os seguintes passos pelos quais se processa esta

análise:

1. Verificação do número de clusters que os modelos fuzzy propostos necessitam para

agrupar as amostras semelhantes em cada classificador;

2. Escolha da menor percentagem de dados de treino para que todos os modelos de decisão

considerados tenham um bom desempenho;

3. Escolha do critério de segmentação QuadTree;

4. Conclusão dos melhores modelos através do critério de desempenho;

5. Verificação de erros de classificação para os melhores classificadores de diferentes

percentagens de treino.

42

5.1. Segmentação QuadTree das amostras digitalizadas

A segmentação das imagens digitais dos mármores é um ponto relevante neste estudo dado que

o conjunto de descritores calculados das amostras depende da qualidade deste método para a

identificação das regiões homogéneas. O algoritmo QuadTree decompõe as imagens em diferentes

regiões através do desvio padrão de luminosidade. Como se consideraram três diferentes valores

para o desvio padrão, 𝑒𝑥𝑝𝑆𝑡𝑑 = [3,5,7], consegue-se obter diferentes famílias de descritores

(𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 e 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7). A textura de cada amostra está diretamente relacionada com a

quantidade de regiões que se consegue definir através desta segmentação. Na Tabela 5-1 observam-

se as diferentes segmentações efetuadas para amostras como exemplo de cada classe de textura e

identificação de venadas (traçado vermelho), as maiores regiões consideradas como predominantes

(traçado verde) e as restantes regiões (traçado azul) dos mármores.

Tabela 5-1: Resultado da segmentação QuadTree das diferentes classes de textura para os diferentes critérios de homogeneidade.

Original 𝑒𝑥𝑝𝑆𝑡𝑑 = 3 𝑒𝑥𝑝𝑆𝑡𝑑 = 5 𝑒𝑥𝑝𝑆𝑡𝑑 = 7

Muito Homogéneo (MH)

(ex: ED_Trovoada_002)

Pouco Homogéneo (PH)

(ex: ED_Art_Deco_003)

Nada Homogéneo (NH)

(ex: FM_Art_Deco_004)

Observam-se diferentes densidades de regiões para cada classe de textura e quanto maior o valor

considerado de 𝑒𝑥𝑝𝑆𝑡𝑑, menor é a decomposição das amostras. Como a técnica de segmentação

QuadTree avalia a homogeneidade particular de cada região, o tempo computacional é maior quanto

menor for 𝑒𝑥𝑝𝑆𝑡𝑑. Para cada classe de textura apresentam-se os tempos médios, máximos e mínimos

de segmentação referentes a cada critério de decomposição (Tabela 5-2)

Para se obter uma classificação de mármores precisa é necessário extrair bons descritores das

amostras de treino para criar modelos de decisão eficientes, no entanto deve ter-se em conta o tempo

total de classificação de cada amostra. O intervalo de tempo despendido na classificação é bastante

inferior ao de segmentação, o que torna irrelevante considerar o tempo de classificação neste estudo.

43

Assim, é necessário escolher o melhor parâmetro de decomposição de imagem, tendo em conta o

seu intervalo de tempo de segmentação.

Tabela 5-2: Tempos de processamento da segmentação QuadTree.

𝑅𝑎𝑤𝐷𝑎𝑡𝑎3 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7

Tempo [s] Média Max Min Média Max Min Média Max Min

MH 5,45 17,83 2,34 1,92 4,70 0,67 0,62 1,93 0,19

PH 9,66 22,39 3,75 3,74 9,37 1,33 1,73 7,58 0,20

NH 14,37 20,30 7,83 9,37 20,08 5,15 5,62 15,02 1,84

5.2. Procedimento para o cálculo dos índices de desempenho

Para cada família de descritores consideram-se os 5 diferentes conjuntos de modelação e, para

cada um destes conjuntos foram criados dois subconjuntos, treino e teste, tal como apresentado na

secção 2.2.4. Uma vez que neste trabalho se pretende fazer um estudo da quantidade mínima de

dados de treino, foram considerados 20%, 40%, 60% e 80% dos dados de modelação para treino. Os

dados constituintes de cada subconjunto de treino foram selecionados pelo método 10x 5-fold para

posteriormente se recorrer à técnica de validação cruzada para que os resultados obtidos de CDP

(apresentado na secção 2.2.5) dos modelos sejam generalizados.

Tendo uma abordagem de classificação de múltiplas classes, para cada classe e cada método de

modelação obtém-se valores do critério de desempenho CDP, considerando as percentagens de

treino e cada conjunto de descritores, dado que são estes os parâmetros a fixar para definir os

melhores classificadores de cor e textura. Na Figura 5-1 apresenta-se um esquema que ajudará na

perceção de todas as variáveis.

Figura 5-1: Estrutura da metodologia para obter resultados de CDP.

Descritores

2

2

44

Lista de variáveis:

𝑛_𝑐𝑙𝑎𝑠𝑠𝑒𝑠 : número de classificadores, no caso de cor são 6 e no caso de textura são 3;

𝐾𝑐𝑜𝑛𝑗 : número de conjuntos de modelação;

𝑛_𝑝𝑒𝑟𝑐 : número de diferentes percentagens consideradas, 4.

Para cada percentagem de treino obtém-se pela técnica de validação cruzada valores médios e

desvios padrão dos resultados CDP de todas combinações de seleção de dados para cada conjunto

de modelação (Tabela 5-3). Adotando uma abordagem conservadora, com a finalidade de que os

resultados de CDP possam ser generalizados para qualquer conjunto de dados escolheram-se os

valores mínimo das médias e máximo dos desvios padrão dos cinco conjuntos de modelação. Assim

para cada percentagem de dados de treino, resulta somente um resultado de CDP.

Tabela 5-3: Resultados de CDP do modelo fuzzy GK clustering para o classificador de ED_Trovoada

com a família de descritores 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑

Conjuntos de Modelação (𝐾𝑐𝑜𝑛𝑗)

𝑓 = 1 𝑓 = 2 𝑓 = 3 𝑓 = 4 𝑓 = 5

20% 0,86 ± 0,07 0,83 ± 0,08 0,86 ± 0,06 0,86 ± 0,08 0,84 ± 0,07

40% 0,94 ± 0,03 0,95 ± 0,03 0,95 ± 0,02 0,95 ± 0,03 0,96 ± 0,03

60% 0,96 ± 0,02 0,97 ± 0,02 0,96 ± 0,02 0,96 ± 0,02 0,97 ± 0,02

80% 0,97 ± 0,02 0,97 ± 0,02 0,97 ± 0,03 0,97 ± 0,02 0,98 ± 0,03

5.3. Parametrização dos modelos fuzzy

Na modelação dos modelos fuzzy existem diversos parâmetros que requerem especificação no

motor de inferência e, como apresentado nas secções 4.2 e 4.3, o único parâmetro que não se

considerou fixo é o número de clusters dos modelos. Para avaliar os modelos criados considerou-se

um critério de desempenho CDP (equação 2.5). A seleção do melhor número de clusters teve em

conta a tendência deste critério para as diferentes conjugações de dados de modelação e

percentagens de treino.

Para esta análise considerou-se a família de descritores 𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, dado que a tendência dos

resultados é idêntica para as outras famílias de descritores. Foram estudados dois métodos de

clustering, GK e FCM, e serão apresentados todos os resultados obtidos para as combinações de

𝑛_𝑐𝑙𝑢𝑠𝑡𝑒𝑟𝑠 (2, 3, 4 e 5) e 𝑛_𝑝𝑒𝑟𝑐 (20%, 40%, 60% e 80% de dados de treino).

5.3.1. Gustafson Kessel Clustering

Nesta secção são apresentados e analisados os resultados obtidos para os modelos fuzzy com

diferentes números de clusters definidos pelo método de GK clustering. Na Figura 5-2 e na Figura 5-3

são representados gráficos dos valores mínimos das médias do critério de desempenho de avaliação

de modelos dos cinco diferentes conjuntos de modelação para todos os classificadores de cor e

45

textura, respetivamente. Assim, e embora de uma forma qualitativa, torna-se possível interpretar os

resultados obtidos, no entanto os valores quantitativos encontram-se no anexoA.1.

a)

b)

c)

d)

e)

f)

Figura 5-2: Resultados de CDP dos classificadores de Cor pelo método GK clustering com diferentes clusters e percentagens de treino. a) ED_Art_Deco; b) ED_Rosa; c) ED_Trovoada; d)

ED_Pastel; e) FM_Art_Deco; f) FM_Sunset.

Com estes resultados observa-se que para 2, 3 e 4 clusters, o valor do desempenho toma valores

superiores quando se aumenta a percentagem de treino, no entanto para 5 clusters pode observar-

se, na maioria das classes, uma descida do desempenho com o aumento da percentagem de treino

dos 20% para 40%. Assim é possível concluir que a escolha de 5 clusters não representa uma boa

divisão de dados nos seus diferentes clusters.

0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)

Percentagem de Treino

0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


46

A curva que obtém melhores resultados para a maioria das classes de cor é a que representa o

modelo que considera 2 clusters, apresentando um grande aumento de desempenho nos 40% de

dados de treino.

a)

b)

c)

Figura 5-3: Resultados de CDP dos classificadores de Textura pelo método GK clustering com diferentes clusters e percentagens de treino. a) Muito Homogéneo; b) Pouco Homogéneo; c) Nada

Homogéneo.

No caso dos classificadores de textura, os resultados para os diferentes números de clusters são

muito idênticos e tomam valores de desempenho inferiores aos observados nas classes de cor. Isto

ocorre porque a pré classificação dos mármores muito homogéneos e pouco homogéneos, é bastante

complicada. Pode então afirmar-se que estes resultados são muito dependentes da subjetividade da

pré classificação.

Quanto mais clusters considerados, mais regras de inferência se precisam correlacionar e avaliar

através da distância de cada amostra aos centros dos clusters, o que implica um modelo mais

complexo e por consequência mais demorado. Como tal, foi considerado o menor número de clusters

possível, apesar de para a classe Muito Homogénea não ser o melhor parâmetro, que tomam valores

de CDP próximos de 0,75.

Através do modelo fuzzy TS baseado em GK clustering conclui-se que para as classificadores de

cor e textura necessita-se dois clusters.

0,70

0,75

0,80

0,85

0,90

0,95

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,70

0,75

0,80

0,85

0,90

0,95

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,70

0,75

0,80

0,85

0,90

0,95

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


47

5.3.2. Fuzzy C-Means Clustering

Admitindo o método de apresentação de resultados anteriormente utilizado, nesta secção

apresentam-se os resultados correspondentes aos modelos fuzzy com diferentes números de clusters

definidos pelo método FCM clustering. Na Figura 5-4 e Figura 5-5 são apresentados os resultados

obtidos de CDP para os modelos de classificação de cor e textura, respetivamente. O método de

obtenção dos resultados é desenvolvido através dos mesmos procedimentos e os valores

quantitativos são apresentados no anexoA.2.

a)

b)

c)

d)

e)

f)

Figura 5-4: Resultados de CDP dos classificadores de Cor pelo método FCM clustering com diferentes clusters e percentagens de treino. a) ED_Art_Deco; b) ED_Rosa; c) ED_Trovoada; d)

ED_Pastel; e) FM_Art_Deco; f) FM_Sunset.

0,4

0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,4

0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%0

,6(T

PR

)+0

,4(S

PC

)Percentagem de Treino

0,4

0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,4

0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,4

0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,4

0,5

0,6

0,7

0,8

0,9

1,0

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


48

a)

b)

c)

Figura 5-5: Resultados de CDP dos classificadores de Textura pelo método FCM clustering com diferentes clusters e percentagens de treino. a) Muito Homogéneo; b) Pouco Homogéneo; c) Nada

Homogéneo.

Para os modelos baseados no método de FCM clustering, o desempenho para 2 clusters

apresenta valores superiores a 0,9 para todas as classes de cor a partir dos 40% de dados de treino.

Os resultados para os modelos de textura apresentam valores muito idênticos aos anteriores, o que

se pode concluir que se deve considerar o menor número de clusters.

Através desta análise conclui-se que para os modelos fuzzy TS baseados em FCM clustering, os

melhores valores de desempenho para os modelos de cor e textura devem definir-se dois clusters

no espaço de dados de treino.

5.4. Model Assessment

Nesta secção são apresentados todos os resultados obtidos para os modelos de decisão fuzzy

baseados nos métodos GK e FCM clustering com 2 clusters e Regressão Logística (RL). O objetivo

deste estudo é definir uma percentagem mínima de dados necessários para treinar os modelos que

permite a obtenção de bons desempenhos na modelação com a finalidade de concluir qual a família

de descritores que melhores resultados obtém, considerando o intervalo de tempo despendido na

segmentação QuadTree dos mesmos apresentados na secção 5.1.

0,70

0,75

0,80

0,85

0,90

0,95

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,70

0,75

0,80

0,85

0,90

0,95

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


0,70

0,75

0,80

0,85

0,90

0,95

20% 40% 60% 80%

0,6

(TP

R)+

0,4

(SP

C)


49

5.4.1. Avaliação da melhor percentagem de treino

Para os diferentes conjuntos de descritores (𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 e 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7) os desempenhos

dos modelos testados para as diferentes percentagens de treino apresentam a mesma tendência de

resultados e, como tal, é possível considerar a melhor percentagem de treino através da avaliação do

desempenho para 𝑅𝑎𝑤𝐷𝑎𝑡𝑎3.

Na Figura 5-6 e na Figura 5-7 são representados histogramas dos valores das médias e dos

desvios padrão, através de barras de erro, do critério de desempenho CDP dos modelos para todas

as percentagens de treino e todos os classificadores de cor e textura, respetivamente. As barras de

erro representadas podem tomar valores superiores a 1 dado que representam os valores do desvio

padrão máximo dos conjuntos de dados de modelação, tal como explicado na secção 5.2. Com esta

representação é possível fazer uma avaliação dos resultados obtidos de todas as combinações de

dados para cada percentagem de treino. No anexoB.1 apresentam-se todos os resultados

quantitativos.

a)

b)

0,55

0,6

0,65

0,70,75

0,8

0,85

0,9

0,951

1,05

ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset

0,6

(TP

R)+

0,4

(SP

C)

20% Treino 40% Treino 60% Treino 80% Treino

0,55

0,6

0,650,7

0,75

0,80,85

0,9

0,95

1

1,05


0,6

(TP

R)+

0,4

(SP

C)


50

c)

Figura 5-6: Resultados de CDP dos classificadores de Cor para as diferentes percentagens de dados de treino consideradas e diferentes modelos de classificação: a) Modelo fuzzy com GK clustering; b)

Modelo fuzzy com FCM clustering; c) Regressão Logística.

Em todos os modelos de decisão e para todas as classes de cor observa-se uma evolução positiva

do desempenho à medida que a percentagem de treino aumenta. No entanto é possível concluir que

para o modelo fuzzy com GK clustering tem-se um aumento do desempenho quando se passa dos

20% para os 40% de dados de treino, tomando valores perto de 0,9. para a maior parte das classes

de cor.

Para o modelo fuzzy com FCM clustering também se verifica um aumento considerável quando

passa de 20% para 40% de dados de treino, não havendo grandes diferenças para as percentagens

seguintes.

A regressão logística apresenta resultados muito idênticos para todas as percentagens, o que leva

a concluir que só necessita de 20% de dados para treino para reproduzir bons resultados. No entanto,

para os outros modelos observa-se que a melhor percentagem de treino para classificar os mármores

nas diferentes famílias de cor é de 40%.

a)

0,55

0,6

0,650,7

0,75

0,8

0,85

0,9

0,951

1,05


0,6

(TP

R)+

0,4

(SP

C)


0,55

0,6

0,65

0,7

0,75

0,8

0,85

0,9

0,95

1

MH PH NH

0,6

(TP

R)+

0,4

(SP

C)


51

b)

c)

Figura 5-7: Resultados de CDP dos classificadores de Textura para as diferentes percentagens de dados de treino consideradas e diferentes modelos de classificação: a) Modelo fuzzy com GK

clustering; b) Modelo fuzzy com FCM clustering; c) Regressão Logística.

Para a classe NH (“nada homogénea”) todos os métodos de classificação apresentam resultados

de CDP próximos de 0,9. No entanto, para as outras classes de textura, o método que apresenta uma

melhor classificação é o modelo fuzzy baseado em GK clustering.

A percentagem de treino não é relevante para os modelos de decisão considerados na

identificação das famílias de textura existentes na galeria de mármores considerada neste trabalho.

Assim conclui-se que a melhor percentagem de dados de treino é de 20% dos dados de modelação,

o que demonstra ser um ótimo resultado para o problema inicial de pré-classificação das amostras.

Conclui-se assim que é necessário 40% dos dados de modelação para criar modelos com bons

índices de desempenho para as diferentes classes de cor, o que equivale a aproximadamente 26

amostras de cada família de cor, e 20% de dados para treinar os classificadores de texturas, o que

equivale a aproximadamente a 35 amostras de cada família de textura.

0,55

0,6

0,65

0,7

0,75

0,8

0,85

0,9

0,95

1

MH PH NH

0,6

(TP

R)+

0,4

(SP

C)


0,55

0,6

0,65

0,7

0,75

0,8

0,85

0,9

0,95

1

MH PH NH

0,6

(TP

R)+

0,4

(SP

C)


52

5.4.2. Avaliação do melhor conjunto de descritores

Com as percentagens de dados para treino fixadas em 40% para os classificadores de cor e 20%

para textura, é necessário concluir qual o melhor conjunto de descritores (𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 e

𝑅𝑎𝑤𝐷𝑎𝑡𝑎7). Uma vez que neste trabalho se apresenta um problema de múltiplas classes de cor e

textura verificou-se a necessidade de adotar uma abordagem conservadora e escolher as classes de

cor e textura que obtiveram piores resultados de desempenho. Assim a escolha do conjunto terá

sempre em conta a classe mais complexa a nível de modelação do sistema de decisão, o que resulta

de bons desempenhos para as restantes.

Na Figura 5-8 são apresentados dois histogramas que identificam os piores desempenhos das

classes de cor e textura dos diferentes modelos de decisão considerados para 𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5

e 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7. Apresentam-se no anexo B.2 os resultados quantitativos.

a)

b)

Figura 5-8: Resultados das classes com piores valores de CDP dos métodos de classificação para os três conjuntos de descritores. a) Cor; b) Textura.

Os resultados obtidos para os diferentes classificadores de cor, não apresentam grandes

diferenças significativas para os diferentes conjuntos de descritores, dado que a maior parte dos

0,5

0,55

0,6

0,65

0,7

0,75

0,8

0,85

0,9

0,95

1


0,6

(TP

R)+

0,4

(SP

C)

GK FCM RL

0,5

0,55

0,6

0,65

0,7

0,75

0,8

0,85

0,9

0,95

1


0,6

(TP

R)+

0,4

(SP

C)

GK FCM RL

53

descritores de cor são extraídos da imagem global. Apesar de se considerarem as quarto maiores

regiões obtidas da segmentação QuadTree como regiões predominantes de cor, para os diferentes

critérios de decomposição de imagem, a informação de cor das regiões predominantes mantêm-se.

Posto isto, a escolha do melhor conjunto de descritores a considerar terá de ter em conta somente os

resultados obtidos dos classificadores de textura.

Como a textura de um mármore está diretamente relacionada com a homogeneidade de cor da

mesma, através do descritor de homogeneidade, equação 3.17, é possível concluir que o resultado

da segmentação é um fator de enorme relevância para a classificação de texturas. Os mármores são

considerados mais homogéneos quanto menor for a decomposição das imagens.

Através da análise da Figura 5-8 b) é possível concluir que o melhor critério de segmentação

QuadTree é decompor cada região que contenha o desvio padrão dos valores de luminosidade

superior a 5.

Concluindo, o conjunto de descritores que prevê uma melhor classificação dos mármores é

𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓. Para a galeria de mármores disponibilizada para este estudo, dependendo da

homogeneidade de cada amostra, o computar utilizado neste estudo (Tabela 3-1) consegue classificar

cada amostra entre os intervalos de tempo apresentados na Tabela 5-4.

Tabela 5-4: Intervalos de tempo computacional de segmentação para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓.

Média Máximo Mínimo

Intervalo de Tempo [s] [1,92; 9,37] [4,70; 20,08] [0,67; 5,15]

5.5. Índices de performance dos modelos

Nesta fase de modelação, foram calculados diversos índices de desempenho para cada modelo

treinado. Como se considerou somente o índice CDP para avaliar os modelos e assim definir os

melhores parâmetros de modelação, verifica-se a necessidade de apresentar os resultados de todos

os índices de desempenho para os parâmetros definidos de modelação para os múltiplos

classificadores de cor e textura.

Apresentam-se então os resultados de AUC (area under the ROC curve), ACC (accuracy), SPC

(specitivity), TPR (sensitivity) e CDP (critério de desempenho ponderado), para os métodos de

decisão inteligente considerados:

Modelo fuzzy com sistema de inferência TS baseado no GK clustering;

Modelo fuzzy com sistema de inferência TS baseado no FCM clustering;

Regressão Logística.

Com o estudo previamente efetuado definiu-se que os modelos que melhor classificavam as

diferentes cores necessitam de 40% dos dados de treino para modelação com os resultados de

54

descritores do conjunto 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5. Na Tabela 5-5, Tabela 5-6 e Tabela 5-7 apresentam-se todos os

valores dos índices de desempenho para as diferentes técnicas de modelação.

Tabela 5-5: Índices de desempenho de GK para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 40% de treino para as diferentes classes de cor.

40% Treino ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset

AUC 0,93±0,07 0,95±0,11 0,92±0,07 0,91±0,07 0,84±0,21 0,92±0,07

ACC 0,91±0,04 0,97±0,03 0,93±0,03 0,88±0,04 0,94±0,03 0,9±0,03

SPC 0,91±0,05 0,97±0,03 0,92±0,04 0,88±0,05 0,98±0,03 0,91±0,04

TPR 0,92±0,07 0,94±0,13 0,94±0,05 0,88±0,09 0,64±0,22 0,86±0,13

CDP 0,92±0,06 0,95±0,09 0,93±0,04 0,88±0,08 0,77±0,14 0,88±0,09

Tabela 5-6: Índices de desempenho de FCM para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 40% de treino para as diferentes classes de cor.


AUC 0,99±0,01 0,96±0,04 0,98±0,02 0,95±0,02 0,96±0,03 0,97±0,01

ACC 0,95±0,02 0,96±0,02 0,95±0,02 0,90±0,04 0,90±0,05 0,93±0,02

SPC 0,96±0,03 0,97±0,02 0,95±0,03 0,90±0,05 0,90±0,06 0,94±0,03

TPR 0,94±0,05 0,91±0,09 0,94±0,04 0,92±0,06 0,93±0,04 0,86±0,09

CDP 0,94±0,04 0,93±0,06 0,95±0,04 0,91±0,05 0,92±0,05 0,90±0,07

Tabela 5-7: Índices de desempenho de RL para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 40% de treino para as diferentes classes de cor.


AUC 0,94±0,02 1,00±0,00 0,96±0,02 0,87±0,05 0,98±0,02 0,92±0,04

ACC 0,94±0,02 0,99±0,01 0,94±0,02 0,90±0,03 0,99±0,01 0,92±0,02

SPC 0,95±0,02 0,99±0,01 0,94±0,02 0,92±0,03 1,00±0,00 0,93±0,02

TPR 0,89±0,05 0,98±0,02 0,93±0,04 0,78±0,10 0,96±0,04 0,83±0,09

CDP 0,91±0,04 0,99±0,01 0,93±0,04 0,83±0,07 0,97±0,03 0,87±0,06

Para os modelos de classificação de texturas, foi definido previamente que seriam necessários 20%

de dados de treino para modelação dos descritores do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓, e nas Tabela 5-8,

Tabela 5-9 e Tabela 5-10 são apresentados os índices de desempenho para os diferentes modelos

considerados.

Tabela 5-8: Índices de desempenho de GK para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 20% de treino para as diferentes classes de textura.

20% Treino MH PH NH

AUC 0,9±0,03 0,86±0,02 0,97±0,02

ACC 0,84±0,03 0,8±0,02 0,93±0,01

SPC 0,85±0,05 0,79±0,06 0,94±0,02

TPR 0,8±0,08 0,8±0,05 0,91±0,07

CDP 0,82±0,07 0,8±0,05 0,92±0,05

55

Tabela 5-9: Índices de desempenho de FCM para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 20% de treino para as diferentes classes de textura.

20% Treino MH PH NH

AUC 0,9±0,02 0,8±0,05 0,97±0,02

ACC 0,83±0,03 0,74±0,05 0,93±0,01

SPC 0,84±0,05 0,72±0,08 0,94±0,02

TPR 0,8±0,08 0,75±0,07 0,91±0,07

CDP 0,82±0,07 0,74±0,07 0,92±0,05

Tabela 5-10: Índices de desempenho de RL para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 20% de treino para as diferentes classes de textura.

20% Treino MH PH NH

AUC 0,93±0,01 0,67±0,03 0,97±0,02

ACC 0,86±0,02 0,61±0,04 0,93±0,01

SPC 0,86±0,04 0,6±0,06 0,94±0,02

TPR 0,84±0,08 0,62±0,07 0,91±0,07

CDP 0,85±0,06 0,61±0,07 0,92±0,05

Relacionando os resultados anteriores e a Figura 5-8 presente na secção 5.3.2 é possível concluir

quais os melhores resultados obtidos de modelação dos sistemas de classificação. Para a

classificação de cor, consegue fazer-se uma análise qualitativa dos resultados apresentados na

Figura 5-8 a), em que o modelo fuzzy TS baseado em FCM clustering apresenta os melhores

resultados do índice de desempenho CDP com valores de AUC e ACC superiores ou iguais a 0,95 e

0,9, respetivamente, em todas as classes de cor.

Na análise para os classificadores de textura apresentados na Figura 5-8 b), o modelo fuzzy TS

baseado em GK clustering apresenta os melhores resultados de CDP e toma valores de AUC e

ACC superiores ou iguais a 0,86 e 0,8, respetivamente, para todas as classes de textura.

5.6. Classificação de novas amostras

Para cada um dos cinco conjuntos de dados de modelação foram escolhidos os modelos que

obtiveram os melhores valores CDP de todas as combinações possíveis para as diferentes

percentagens de dados de treino referentes a cada classificador de cor e textura. No entanto, para

avaliar a classificação das amostras pertencentes aos conjuntos de verificação, são calculadas

percentagens de erro para os diferentes tipos de sistemas de predição de classificação com diferentes

percentagens de dados treino. Assim é possível verificar se os resultados obtidos na fase de

modelação representam efetivamente uma boa classificação para amostras que nunca tiveram

“conhecimento”. A classificação de cor é considerada independente da classificação de textura, o que

pode resultar em diferentes técnicas de modelos de decisão.

56

5.6.1. Classificação de cor dos conjuntos de amostras de

verificação

Cada conjunto de verificação para a classificação de cor contem 98 amostras e dado que existem

cinco diferentes subconjuntos de modelação e verificação só se podem avaliar os resultados de

classificação para o conjunto de dados de verificação complementares de cada conjunto de

modelação.

Para a classificação de cor, as novas amostras podem ser classificadas numa das classes

existentes ou em nenhuma delas. Cada classificador de cor, 𝐶𝑐𝑜𝑟 tem associado um valor de threshold

𝑡𝐶𝑐𝑜𝑟 , calculado na fase de treino, para transformar o resultado real 𝑝𝐶𝑐𝑜𝑟 (𝑛) num valor booleano

𝑝′𝐶𝑐𝑜𝑟 (𝑛) (equação 4.16) e definir a classe a que a amostra 𝑛 pertence. Na fase de modelação o

modelo fuzzy baseado na técnica de clustering FCM com 40% de dados de treino para a família de

descritores 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 apresentou o melhor desempenho na previsão de classificação de cor para

novas amostras e na Figura 5-9 estão representados os resultados dos valores de pertença das novas

amostras 𝑝𝐶𝑐𝑜𝑟 (𝑛), o valor esperado 𝑉𝑝𝐶𝑐𝑜𝑟 (𝑛) e o threshold 𝑡𝐶𝑐𝑜𝑟 para as respetivas classes.

Figura 5-9: Resultados obtidos dos seis classificadores de cor para 98 novas amostras.

Para verificar qual o modelo que prevê a melhor classificação das amostras de mármore nas

diferentes cores consideradas neste trabalho, calculam-se as percentagens de erro através da

equação 5.1, tal como os valores médios e desvios padrão dos diferentes conjuntos de dados de

verificação (𝐾𝑐𝑜𝑛𝑗) para 𝑝𝑡 = 2, referente a 40% de treino, e 𝑀 = 2, ao modelo FCM.

%𝑒𝑟𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑖𝑓𝑖𝑐𝑎çã𝑜 = 𝑒𝑝𝑡,𝑀 =∑[𝑉𝑝𝑐(𝑛)≠𝑝′𝑐(𝑛)]

𝑁𝑎 (5.1)

Classificação Prevista Classificação Real Threshold de classificação positiva

Observações

Val

ore

s d

e P

erte

nça

ED_Art_Deco ED_Rosa ED_Trovoada

Observações

Val

ore

s d

e P

erte

nça

ED_Pastel FM_Art_Deco FM_Sunset

57

Desta forma, calcula-se para todas as combinações de 𝑝𝑡 e 𝑀 o valor de 𝑒𝑝𝑡,𝑀. Advém de um

conjunto de resultados (Tabela 5-11) que vai refletir a escolha do melhor modelo de

classificação de cor.

Tabela 5-11: Resultados de 𝒆𝒑𝒕,𝐌 para classificação de cor.

GK FCM RL

20% 14,58±4,09 5,76±2,50 8,43±4,04

40% 3,90±1,14 4,93±2,24 6,37±1,52

60% 3,09±2,53 4,93±1,99 6,17±2,08

80% 2,88±1,70 5,35±2,25 5,96±1,71

O valor realçado a vermelho refere-se ao melhor modelo de classificação previsto na fase de treino

e o valor a negrito refere-se ao melhor resultado obtido de todas as combinações de modelos e

percentagens de treino. Dado que o melhor resultado é para uma percentagem de treino de 80%,

considera-se que é um valor muito elevado para fazer uma pré classificação dos mármores,

correspondendo a aproximadamente 45 amostras para cada cor. Assim, considerou-se 40% de dados

de treino como a melhor percentagem, o que corresponde a 26 amostras a serem pré classificadas

para cada classe de cor, e para o modelo fuzzy baseado na técnica de clustering GK o erro médio de

classificação é de 3,9%, o que corresponde a menos 1,03% para o melhor resultado obtido.

No anexo C.1 apresentam-se as imagens classificadas do conjunto de verificação que obteve o

menor erro de classificação para os múltiplos classificadores de cor baseados no modelo fuzzy com

sistemas de inferência baseadas na técnica de clustering GK com 40% de dados de treino.

5.6.2. Classificação de textura dos conjuntos de amostras de

verificação

Como apresentado anteriormente, existem cinco conjuntos de dados de verificação e as amostras

de cada conjunto só podem ser classificadas para os modelos produzidos pelos respetivos conjuntos

de modelação.

Para a classificação de textura, as novas amostras terão de ser classificadas numa das classes

existentes, considerando o maior valor obtido de 𝑝𝐶𝑡𝑥𝑡(𝑛) de cada amostra 𝑛 para os diferentes

classificadores de textura 𝐶𝑡𝑥𝑡. Na fase de modelação o modelo fuzzy baseado na técnica de clustering

GK com 20% de dados de treino para a família de descritores 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 apresentou o melhor

desempenho na previsão de classificação de textura para novas amostras e na Figura 5-10 estão

representados os resultados dos valores de pertença das novas amostras 𝑝𝐶𝑡𝑥𝑡(𝑛) e o valor esperado

𝑉𝑝𝐶𝑡𝑥𝑡(𝑛) para as respetivas classes de textura.

58

Figura 5-10: Resultados obtidos dos três classificadores de textura para 98 novas amostras.

Considerando novamente a percentagem de erro de classificação (equação 5.1), para todas as

combinações de 𝑝𝑡 e 𝑀 foram calculados os valores de 𝑒𝑝𝑡,𝑀. A Tabela 5-12 apresenta um conjunto

de resultados que reflete a escolha do melhor modelo de classificação de textura.

Tabela 5-12: Resultados de 𝒆𝒑𝒕,𝑴 para classificação de textura.

GK FCM RL

20% 16,46 ± 5,63 17,29 ± 6,24 28,15 ± 6,25

40% 18,30 ± 5,12 16,25 ± 4,22 30,82 ± 4,95

60% 17,69 ± 4,10 17,89 ± 4,49 32,05 ± 7,78

80% 17,29 ± 6,11 19,94 ± 4,98 31,65 ± 6,80

O valor realçado a vermelho refere-se ao melhor modelo de classificação previsto na fase de treino

e o valor a negrito refere-se ao melhor resultado obtido de todas as combinações de modelos e

percentagens de treino. O melhor resultado é para uma percentagem de treino de 40%,

correspondendo a aproximadamente 55 amostras para cada textura. No entanto não apresenta um

erro consideravelmente menor que o resultado obtido pelo modelo que previu as melhores

classificações na fase de modelação, recorrendo a 20% de dados para treino Assim, considerou-se

20% de dados de treino como a melhor percentagem, o que corresponde a 28 amostras a serem pré

classificadas para cada classe de textura, para classificadores modelados por um modelo fuzzy

baseado na técnica de clustering GK. O erro médio de classificação é de 16,46%, o que apesar de

ser um valor substancial poderá apresentar uma classificação mais precisa do que o que se apresenta

na pré-classificação, dado a subjetividade do critério de textura.

No anexo C.2 apresentam-se as imagens classificadas do conjunto de verificação que obteve o

menor erro de classificação para os múltiplos classificadores de textura baseados no modelo fuzzy

com sistemas de inferência baseadas na técnica de clustering GK com 20% de dados de treino.

Classificação Prevista Classificação Real

Observações

Val

ore

s d

e P

erte

nça

Muito Homogéneo Pouco Homogéneo Nada Homogéneo

59

5.6.3. Classificação de cor e textura de amostras não

consideradas no estudo dos modelos de decisão

Adotando a metodologia da classificação de amostras pré classificadas nas diferentes classes de

cor e textura foram consideradas agora as 108 amostras rejeitadas no início do estudo. Estas

amostras são denominadas de ED_Construção, ED_Medio, ED_Trovoada_Medio, ED_Aguarela e

FM_Rajada. A Figura 5-11 apresenta as amostras modelo para cada uma destas famílias de cor de

mármore consideradas neste trabalho e na Figura 5-12 as diferentes famílias de cor das novas

amostras.


Figura 5-11: Amostras modelo das diferentes famílias de mármore estudadas.

ED_Construção ED_Medio ED_Trovoada_Medio ED_Aguarela FM_Rajada

Figura 5-12: Amostras modelo das diferentes famílias de mármore das amostras rejeitadas.

Através das imagens apresentadas percebe-se que as famílias presentes na Figura 5-12, apesar

de não terem sido consideradas para o estudo, devido à pequena quantidade de amostras

disponíveis, têm algumas semelhanças com as famílias de mármore dos modelos de classificação

considerados neste trabalho.

Este estudo pretende concluir se com os classificadores de textura criados conseguem distinguir-

se os diferentes níveis de homogeneidade dos mármores e se as classificações de cor são aceitáveis

dado que não pertencem a nenhuma das famílias de cor previamente conhecidas. Através de uma

análise qualitativa das amostras alocadas em diferentes conjuntos de cor (Figura 5-13) e textura

(Figura 5-14), é possível concluir quanto à qualidade do sistema de classificação automática para

amostras, nunca antes consideradas, comparando com algumas amostras modelo dessas mesmas

classes.

ED_Construcao ED_Medio ED_Trovoada_Medio ED_Aguarela FM_Rajada

60

Com esta análise qualitativa, pode concluir-se que a classificação obtida para as diferentes classes

de cor e textura das amostras rejeitadas apresentam boas semelhanças nas diferentes classes.

a) Modelos de a)

b) Modelos de b)

c) Modelos de c)

d) Modelos de d)

61

e)

Figura 5-13: Classificação de cor das amostras rejeitadas. a) ED_Art_Deco; b) ED_Rosa; c) FM_Art_Deco; d) FM_Sunset; e) Indiferenciado.

a)

62

b)

c)

Figura 5-14: Classificação de textura das amostras rejeitadas. a) Muito Homogéneo; b) Pouco Homogéneo; c) Nada Homogéneo.

63

Conclusões e Trabalho Futuro

Este trabalho foi realizado com o intuito de estudar uma nova forma de classificar pedras de

mármore polidas para resolver um problema atual na fase de classificação na indústria. Sugere-se

uma classificação automática de ladrilhos de mármores através de semelhanças de cor e textura, de

uma forma rápida e precisa.

O estudo considerou um sistema de múltiplos classificadores referentes a cada classe de cor e

textura que os operadores especializados da fábrica pré classificaram. Desta forma torna-se possível

generalizar este trabalho para qualquer galeria de mármores, dado que cada classificador representa

uma única classe. Este método é vantajoso porque assim cada fábrica pode criar os seus

classificadores dependendo dos mármores que obtêm, com a possibilidade de se puder adicionar

uma nova classe de cor sem despender um intervalo de tempo elevado a treinar novamente os

classificadores já definidos. Também se apresenta como vantagem o facto de o utilizador puder

escolher quais os classificadores que pretende considerar na classificação de novos mármores,

diminuindo o erro de classificação ao considerar todas as classes.

A obtenção dos descritores dos mármores digitalizados teve em conta as principais características

de cor e textura que os operadores avaliam e como tal recorreu-se a uma segmentação QuadTree

para extrair informação sobre as venadas, homogeneidade e as cores predominantes das pedras. O

estudo dos critérios de decomposição para a segmentação são importantes dado que existe a

necessidade de uma classificação célere, não perdendo informação importante das pedras. Estudos

anteriores utilizaram descritores de cor globais e como tal foram considerados 12 descritores de cor

baseados nas médias e desvios padrão do espaço de cores RGB e HSV para criar um conjunto de

descritores mais completo.

A implementação de técnicas de classificação teve em consideração os diversos estudos feitos

sobre o tema e assim consideram-se três métodos de modelação baseados em: Regressão Logística

(RL) e modelos fuzzy baseados em sistemas de inferência Takagi-Sugeno (TS) de primeira ordem

com técnicas de clustering Gustafson-Kessel (GK) e Fuzzy c-Mean (FCM). Foram consideradas duas

fases para obter os melhores classificadores de cor e textura das amostras disponíveis, que

constituem 6 classes de cor e 3 de textura. Na fase de modelação avalia-se para os diferentes

modelos de decisão e diferentes percentagens de dados de treino a qualidade de classificação

prevista e, posteriormente na fase de verificação, com as amostras que não foram consideradas na

fase anterior, classificam-se através dos classificadores que obtêm os melhores resultados do critério

de desempenho ponderado (CDP) na fase de modelação. Assim é possível avaliar a classificação de

novas amostras de mármore através de uma percentagem de erro e definir a quantidade de amostras

necessárias para construir os múltiplos classificadores. Foi considerado o conjunto 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 de

descritores como os que obtiveram melhores resultados na fase de modelação.

Com todos os parâmetros anteriores considerados, obteve-se a melhor percentagem de erro na

fase de verificação dos múltiplos classificadores de cor modelados com 40% de dados para treino,

que equivale a 26 amostras de cada classe de cor, através de um modelo fuzzy baseado num sistema

64

de inferência TS de primeira ordem com a técnica de clustering GK, resultando de 3,9% de

classificações erradas. Para a classificação de textura resultaram 16,46% de classificações erradas

dos dados de verificação para os múltiplos classificadores modelados com 20% de dados de treino,

que equivale a 28 amostras de cada classe de textura, através do mesmo modelo considerado para

a classificação de cor.

A comparação destes resultados com outros trabalhos anteriormente desenvolvidos não foi trivial

uma vez que se basearam somente nos resultados da fase de modelação e este trabalho apresenta

resultados da fase de classificação. No entanto, no trabalho desenvolvido em 2004 por Sousa et al

[14] obtiveram-se percentagens de erro da classificação de cor dos dados de teste para modelos

baseados em redes neuronais de 19,9% e para a classificação de textura o melhor resultado foi para

modelos fuzzy TS otimizado com um algoritmo genético que obteve 20,9% de erro para os dados de

teste. Assim conclui-se que o método de múltiplos classificadores desenvolvido neste trabalho

consegue classificar novas amostras de mármores com uma melhor precisão.

O tempo de classificação torna-se irrelevante comparativamente com o tempo de extração de

descritores das imagens. Com o parâmetro de segmentação dos mármores que melhor caracterizam

em termos de cor e textura, pode afirmar-se que os descritores que constituem cada amostra no

conjunto 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 têm um intervalo de tempo computacional entre 0,67s e 20,08s dependendo do

grau de homogeneidade do ladrilho. Apresenta-se como um dos principais resultados a cadência da

classificação automática que varia entre 180 e 5300 mármores por hora, através do computador

utilizado neste estudo (especificações presentes na Tabela 3-1), o que torna muito apelativo dado

que um operador consegue classificar em média 80 ladrilhos de mármores por hora.

No seguimento deste estudo, é proposto que este sistema seja implementado no protótipo

StoneScan, adaptando todo o código desenvolvido em Matlab para C e por sua vez ligado a uma

interface com o utilizador. O sistema de classificação por múltiplos classificadores desenvolvido

apresenta bons resultados para o conjunto de dados considerados neste trabalho, no entanto será

necessário verificar se os resultados de classificação são efetivamente generalizados para outras

galerias de mármores. Para melhorar o desempenho do sistema na classificação de textura, propõe-

se que seja estudado outro tipo de descritores que representem melhor as características de

homogeneidade dos mármores e para os descritores de cor fazer um estudo de quais as

características mais relevantes. O modelo de decisão proposto neste trabalho, apesar de apresentar

bons resultados na classificação de novos mármores, pode ser otimizado com outros algoritmos de

clustering.

O trabalho desenvolvido nesta dissertação deu origem a um artigo científico que foi aceite para

“21th edition of the Portuguese Conference on Pattern Recognition” (RecPad2015).

.

65

Bibliografia

[1] S. M. Marcora, W. Staiano e V. Manning, “Mental fatigue impairs physical performance in

humans,” Journal of Applied Physiology, vol. 106 no. 3, pp. 857-864, 2009.

[2] E. M.Winkler, “Weathering and weathering rates of natural stone,” Environmental Geology

and Water Sciences, Volume 9, Issue 2, pp. 85-92, 1987.

[3] H. A. e. P. Centro de Estudos de Cultura, “CECHAP,” 14 Junho 2012. [Online]. Available:

http://www.cechap.com/index.php/projectos/item/15-him.

[4] P. Smitha, L. Shaji e M. G. Dr. Mini, “A Review of Medical Image Classification

Techniques,” International Journal of Computer Applications, pp. 34-38, 2011.

[5] M. Erdogan, “Measurement of polished rock surface brightness by image tile

classification,” Engineering Geology, vol. 57, pp. 65-72, 2000.

[6] P. L. Carrilho e S. Turchetta, “An automatic visual system for marble tile classification,”

Journal of engineering Manufacture, vol. 216, pp. 1095-1108, 2002.

[7] L. Cinque, G. Ciocca, S. Levialdi, A. Pellicanò e R. Schettini, “Color-based image retrieval

using spatial-chromatic histograms,” Image and Vision Computing, vol. 19, pp. 979-986,

2001.

[8] H. Alexandre e J. Caldas Pinto, “New Wavelets based features for natural surface

indexing,” First International Conference on Computer Vision theory and Applications, pp.

311-316, 25-28 February 2006.

[9] J. Luis-Delgado, J. Martínez-Alajarín e L. Tomas-Balibrea, “Classification of marble

surfaces using wavelets,” Electronic Letters, vol. 39, pp. 714-715, 2003.

[10] J. L. Sobral, “Leather Inspection Based on Wavelets,” IbPRIA, pp. 682-688, 2005.

[11] J. Caldas Pinto, A. Marcolino e A. Ramalho, “Clustering Algorithm for color segmentation,”

V Ibero American Symposium on Patterin Recognition, pp. 123-135, 11-13 Setembro 2000.

[12] J. R. Caldas Pinto, P. Pina, V. Ramos e M. Ramalho, “Clustering Techiques for Marble

Classification,” 12th Portuguese Conference on Pattern Recognition, 27-28 Junho 2002.

[13] J. R. Caldas Pinto, J. M. Sousa e H. Alexandre, “New Distance Measures Applied to

Marble Classification,” Progress in Pattern Recognition Speech and Image Analysis, pp. 383-

390, 2003.

[14] J. M. C. Sousa e J. R. Caldas Pinto, “Comparison of Intelligent Classification Techniques

Applied to Marble Classification,” Image Analysis and Recognition, pp. 802-809, 2004.

66

[15] N. Benavente e P. Pina, “Morphological segmentation and classification of marble textures

at macroscopical scale,” Computers and Geociences, vol. 35, pp. 1194-1204, 2009.

[16] T. Barata e P. Pina, “A morphological approach for feature space partitioning,” IEEE

Geoscience and Remote Sensing Letters, vol. 3, pp. 173-177, 2006.

[17] J. Martínez-Cabeza-de-Vaca-Alajarín e L.-M. Tomás-Balibrea, “Marble Slabs Quality

Classification System using Texture Recognition and Neural Networks Methodology,”

European Symposium on Artificial Neural Networks, pp. 75-80, 21-23 Abril 1999.

[18] I. Topalova, “Automated Marble Plate Classification System Based on Different Neural

Network Input Trainnig Sets and PLC Implementation,” International Journal of Advancer

Research ir Artificial Intelligence, vol. 1, pp. 50-56, 2012.

[19] R. Datta, D. Joshi, J. Li e J. Z. Wang, “Image Retrieval: Ideas, Influences and Trends of

the New Age,” ACM Comouting Surveys, vol. 40 no. 2, pp. 1-60, 2008.

[20] G. S. Linoff e M. J. Berry, Data mining techniques: for marketing, sales, and customer

relationship management, John Wiley & Sons, 2004.

[21] U. Fayyad, G. Piatetsky-Shapiro e P. Smyth, “From data mining to Knowledge discovery

in Databases,” AI Magazine, vol. 17 no. 3, pp. 37-54, 1996.

[22] S. Chakrabarti, E. Cox, E. Frank, R. H. Gûting, J. Han, X. Jiang, M. Kamber, S. S.

Lightstone, T. P. Nadeau e R. E. Neapolitan, Data Mining: know it all, Burlington: Morgan

Kaufmann, 2008.

[23] I. Guyon e A. Elissef, “An Introduction to Variable and Feature Selection,” Journal of

Machine Learning Research, vol. 3, pp. 1157-1182, 2003.

[24] I. Guyon, M. Nikravesh, S. Gunn e L. A. Zadeh, Feature Extraction: Foundations and

Applications, Berlin Heidelberd: Springer, 2006.

[25] C. M. Bishop, Pattern Recognition and Machine Learning, Springer, 2006.

[26] H. Adbi e L. J. Williams, “Principal component analysis,” em Interdisciplinary reviews:

Computational Statistics, Wiley, 2010, pp. 433-459.

[27] P. A. Devijver e J. Kittler, Pattern recognition: A statistical approach, London: Prentice-

Hall, 1982.

[28] L. I. Kuncheva, Combining Pattern Classifiers: Methods and Algorithms, New Jersey: John

Wiley and Sons, 2004.

[29] T. Hastie, R. Tibshirami e J. Friedman, “The Elements of Statistical Learning,” em Data

Mining, Inference and Prediction, Stanford, California, Springer, 2008.

67

[30] Y. Zhang e Y. Yang, “Cross-validation for selecting a model selection procedure,” Journal

of Econometrics, vol. 187, pp. 95-112, 2015.

[31] S. V. Stehman, “Selecting and Interpreting Measures of Thematic Classification Accuracy,”

Remote Sensing of Environment, vol. 62, pp. 77-89, 1997.

[32] E. W. Steyerberg, A. J. Vickers, N. R. Cook, T. Gerds, M. Gonen, N. Obuchowski, M. J.

Pencina e M. W. Kattan, “Assessing the performance of prediction models: a framework for

some traditional and novel measures,” Epidemiology, vol. 21, pp. 128-138, 2010.

[33] A. S. Fialho, F. Cismondi, S. M. Vieira, S. R. Reti, J. M. Sousa e S. N. Finkelstein, “Data

mining using clinical physiology at discharde to predict ICU readmissions,” Expert Systems

with Applications, pp. 13158-13165, 2012.

[34] R. D. Pereira, C. M. Salgado, A. Dejam, S. R. Reti, S. M. Vieira, J. M. Sousa, L. A. Celi e

S. N. Finkelstein, “Fuzzy Modeling to Predict Severely Depressed Left Ventricular Ejection

Fraction following Admission to the Intensive Care Unit Using Clinical Physiology,” The

Scientific World Journal, Hindawi, 2015.

[35] J. L. Viegas, S. M. Vieira e J. M. Sousa, “Fuzzy clustering and prediction of electricity

demand based on household characteristics,” 16th World Congress of the International Fuzzy

Systens Association, 2015.

[36] T. Kumar e K. Verma, “A Theory Based on Conversion of RGB image to Gray image,”

International Journal of Compiter Applications, vol. 7 no.2, pp. 7-10, 2010.

[37] A. R. Smith, “Color gamut transform pairs,” ACM SIGGRAPH Computer Graphics, vol. 12

no.12, pp. 12-19, 1978.

[38] R. Keys, “Cubic convolution interpolation for digital image processing,” Acoustics, Speech

and Signal Processing, vol. 29, pp. 1153-1160, 1981.

[39] L. Chandrika, “Implementation Image Retrieval and Classification with SURF Technique,”

International Journal of Innovative Science, Engineering and Technology, vol. 1, pp. 280-284,

2014.

[40] G. Dorko e C. Schmid, “Selection of scale-invariant parts for object class recognition,”

Computer Vision, vol. 1, pp. 634-638, 2003.

[41] K. Mikolajczyk e C. Schmid, “Scale and Affine Invariant Interest Point Detectors,”

International Journal of Computer Vision, vol. 60, pp. 63-86, 2004.

[42] M. Calonder, V. Lepetit, C. Strecha e P. Fua, “BRIEF: Binary Robust Independent

Elementary Features,” Computer Vision - ECCV 2010, vol. 6314, pp. 778-792, 2010.

68

[43] M. Calonder, V. Lepetit e P. Fua, “Keypoint Signatures for Fast Learning and Recognition,”

Compurter Vision - ECCV 2008, vol. 5302, pp. 58-71, 2008.

[44] F. P. Incropera, D. P. Dewitt, T. L. Bergman e A. S. Lavine, Fundamentals of Heat and

Mass Transfer, New Delhi: Wiley India, 2013.

[45] G. H. Joblove e D. Greenberg, “Color spaces for computer graphics,” Computer gra+hics

and interative tecnhiques, vol. 12, pp. 20-25, 1978.

[46] Z. Qiang, Y. Jie, Y. Jingyi e L. Hongxing, “Stone Images Retrieval Based on Color

Histogram,” Image Analysis and Signal Processing, pp. 157-161, 2009.

[47] T. Alphonsa e A. Sreekumar, “A Survey on Image Feature Descriptors-Color, Shape and

Texture,” International Journal of Computer Science and Information Technologies, vol. 5, pp.

7847-7850, 2014.

[48] G. Pass, R. Zabih e J. Miller, “Comparing Images using Color Coherence Vectors,”

Proceedings of the fourth ACM international conference on Multimedia, pp. 65-73, 1997.

[49] P. C. Chen e T. Pavlidis, “Segmentation by texture using a co-occurence matrix and a

split-and-merge,” Computer Graphics and Image Processing, vol. 10, pp. 172-182, 1972.

[50] R. Haralick, K. Shanmugam e I. Dinstein, “Textual Features for image classification,”

Systems, Man ang Cybernetics, vol. 3 SMC, pp. 610-621, 1973.

[51] H. Samet, “The Quadtree and Related Hierarchical Data Structures,” ACM Computing

Surveys, vol. 16, pp. 187-260, 1984.

[52] M. Gong e Y.-H. Yang, “Quadtree-based genetic algorithm and its applications to computer

vision,” The Journal of the Pattern Recognition Society, vol. 37, pp. 1723-1733, 2004.

[53] D. R. Cox, “The regression analysis of binary sequences (with discussion),” J Roy Stat

Soc B, vol. 20, pp. 215-242, 1958.

[54] D. W. Hosmer e S. Lemeshow, Applied Logistic Regression, Second Edition, John Wiley

and Sons, Inc, 2000.

[55] J. S. Cramer, Logit Models from Economics and Other Fields, Cambridge: Cambridge

University Press, 2003.

[56] J. M. Sousa e U. Kaymak, Fuzzy decision making in modeling and control, Singapura:

World Scientific, 2002.

[57] T. Takagi e M. Sugeno, “Fuzzy Identification of Systems and its Application to Modeling

and Control,” IEEE Transactions on Systems, Man and Cybernetics, vol. 15 SMC no.1, pp.

116-132, 1985.

69

[58] R. Babuska, Fuzzy modeling for control, Kluwer Academic Publishers, 1998.

[59] U. Kaymak, “Extended Fuzzy Clustering Algorithms,” ERIM Report Series Research in

Management, p. 24, 2000.

[60] J. C. Bezdek, Pattern recognition with fuzzy objective function algorithms, USA: Kluwer

Academic Publishers, 1981.

[61] J. C. Bezdek, R. Ehrlich e W. Full, “FCM: the Fuzzy c-Means clustering algorithm,”

Computers and Geociences, vol. 10, pp. 191-203, 1984.

[62] R. N. Pal e J. C. Bezdek, “On cluster validity for the fuzzy c-means model,” IEEE

Computational Intelligence Society, vol. 3, pp. 370-379, 1995.

[63] J. C. Dunn, “A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact

Well-Separated Clusters,” Cybernetic and Systems, vol. 3, pp. 32-57, 1973.

[64] D. E. Gustafson e W. C. Kessel, “Fuzzy clustering with fuzzy covariance matrix,” Decision

and Control including the 17th Symposium on Adaptative Process, pp. 761-766, 1978.

[65] S. É. Parent, L. E. Parent, D. E. Rozanne, A. Hernandes e W. Natale, Nutrient Balance as

Paradigm of Soil and Plant Chemometrics, 2012.

[66] M. Galar, A. Fernández, E. Barrenechea, H. Bustince e F. Herrera, “An overview od

ensemble methods for binary classifiers in multi-class problems: Ezperimental study on one-

vs-one and one-vs-all schemes,” Pattern Recognition, vol. 44, pp. 1761-1776, 2011.

70

I

Anexos

Anexo A - Valores quantitativos dos diferentes métodos de clustering para a definição da quantidade de clusters a considerar para os múltiplos classificadores.

A.1. GK clustering.

A 1: Resultados de CDP da Classe ED_Art_Deco para modelo fuzzy com GK clustering.

2 Clusters 3 Clusters 4 Clusters 5 Clusters

20% Treino 0,77±0,12 0,58±0,14 0,61±0,13 0,66±0,12

40% Treino 0,91±0,07 0,81±0,10 0,73±0,11 0,66±0,09

60% Treino 0,92±0,05 0,87±0,09 0,86±0,10 0,79±0,12

80% Treino 0,93±0,06 0,92±0,06 0,91±0,09 0,87±0,10

A 2: Resultados de CDP da Classe ED_Rosa para modelo fuzzy com GK clustering.


20% Treino 0,79±0,14 0,79±0,16 0,83±0,15 0,86±0,11

40% Treino 0,92±0,11 0,87±0,13 0,84±0,13 0,80±0,14

60% Treino 0,98±0,03 0,95±0,08 0,91±0,10 0,85±0,13

80% Treino 0,98±0,03 0,97±0,05 0,96±0,06 0,93±0,07

A 3: Resultados de CDP da Classe ED_Trovoada para modelo fuzzy com GK clustering.


20% Treino 0,84±0,07 0,62±0,12 0,62±0,11 0,70±0,10

40% Treino 0,94±0,03 0,92±0,04 0,84±0,08 0,72±0,10

60% Treino 0,96±0,02 0,95±0,03 0,92±0,04 0,89±0,05

80% Treino 0,97±0,03 0,96±0,03 0,94±0,03 0,93±0,05

A 4: Resultados de CDP da Classe ED_Pastel para modelo fuzzy com GK clustering.


20% Treino 0,67±0,12 0,60±0,12 0,64±0,13 0,66±0,13

40% Treino 0,87±0,07 0,73±0,11 0,68±0,11 0,65±0,10

60% Treino 0,88±0,07 0,84±0,10 0,79±0,11 0,72±0,10

80% Treino 0,91±0,08 0,88±0,09 0,88±0,09 0,80±0,12

A 5: Resultados de CDP da Classe FM_Art_Deco para modelo fuzzy com GK clustering.


20% Treino 0,80±0,13 0,83±0,13 0,87±0,13 0,88±0,10

40% Treino 0,77±0,14 0,76±0,13 0,77±0,14 0,76±0,14

60% Treino 0,86±0,13 0,78±0,12 0,77±0,12 0,75±0,13

80% Treino 0,96±0,08 0,83±0,13 0,78±0,16 0,77±0,14

A 6: Resultados de CDP da Classe FM_Sunset para modelo fuzzy com GK clustering.


20% Treino 0,73±0,11 0,59±0,10 0,58±0,12 0,65±0,12

II

40% Treino 0,86±0,09 0,76±0,11 0,69±0,10 0,66±0,10

60% Treino 0,90±0,07 0,85±0,10 0,79±0,11 0,74±0,11

80% Treino 0,91±0,08 0,87±0,10 0,88±0,10 0,81±0,12

A 7: Resultados de CDP da Classe Muito Homogéneo para modelo fuzzy com GK clustering.


20% Treino 0,74±0,04 0,73±0,05 0,72±0,06 0,72±0,06

40% Treino 0,75±0,03 0,75±0,04 0,76±0,04 0,76±0,04

60% Treino 0,75±0,05 0,76±0,05 0,77±0,05 0,77±0,05

80% Treino 0,75±0,08 0,77±0,08 0,77±0,08 0,77±0,08

A 8: Resultados de CDP da Classe Pouco Homogéneo para modelo fuzzy com GK clustering.


20% Treino 0,75±0,04 0,75±0,03 0,74±0,04 0,72±0,03

40% Treino 0,77±0,03 0,76±0,03 0,76±0,03 0,76±0,03

60% Treino 0,78±0,03 0,77±0,03 0,77±0,03 0,77±0,03

80% Treino 0,78±0,05 0,78±0,05 0,77±0,05 0,77±0,05

A 9: Resultados de CDP da Classe Nada Homogéneo para modelo fuzzy com GK clustering.


20% Treino 0,88±0,04 0,86±0,06 0,84±0,06 0,84±0,07

40% Treino 0,90±0,03 0,89±0,03 0,89±0,04 0,88±0,04

60% Treino 0,91±0,03 0,90±0,03 0,90±0,03 0,90±0,04

80% Treino 0,91±0,04 0,91±0,05 0,91±0,05 0,90±0,05

A.2. FCM clustering.

A 10: Resultados de CDP da Classe ED_Art_Deco para modelo fuzzy com FCM clustering.


20% Treino 0,89±0,04 0,55±0,17 0,62±0,12 0,59±0,11

40% Treino 0,94±0,03 0,88±0,12 0,65±0,13 0,61±0,10

60% Treino 0,95±0,03 0,94±0,05 0,76±0,13 0,68±0,12

80% Treino 0,95±0,04 0,95±0,04 0,80±0,14 0,73±0,13

A 11: Resultados de CDP da Classe ED_Rosa para modelo fuzzy com FCM clustering.


20% Treino 0,75±0,15 0,55±0,19 0,65±0,11 0,63±0,14

40% Treino 0,89±0,06 0,69±0,13 0,66±0,12 0,62±0,12

60% Treino 0,92±0,05 0,76±0,12 0,70±0,11 0,65±0,11

80% Treino 0,92±0,07 0,77±0,13 0,72±0,13 0,68±0,14

A 12: Resultados de CDP da Classe ED_Trovoada para modelo fuzzy com FCM clustering.


20% Treino 0,90±0,05 0,47±0,11 0,58±0,11 0,66±0,09

40% Treino 0,96±0,02 0,87±0,07 0,74±0,09 0,68±0,09

III

60% Treino 0,97±0,02 0,90±0,05 0,80±0,08 0,72±0,07

80% Treino 0,97±0,03 0,90±0,07 0,81±0,09 0,74±0,10

A 13: Resultados de CDP da Classe ED_Pastel para modelo fuzzy com FCM clustering.


20% Treino 0,84±0,07 0,53±0,17 0,58±0,13 0,59±0,13

40% Treino 0,91±0,03 0,84±0,09 0,72±0,13 0,55±0,11

60% Treino 0,91±0,03 0,90±0,07 0,79±0,11 0,59±0,14

80% Treino 0,92±0,06 0,91±0,07 0,82±0,12 0,64±0,16

A 14: Resultados de CDP da Classe FM_Art_Deco para modelo fuzzy com FCM clustering.


20% Treino 0,85±0,10 0,57±0,21 0,68±0,13 0,66±0,12

40% Treino 0,91±0,02 0,81±0,12 0,68±0,12 0,66±0,13

60% Treino 0,92±0,03 0,81±0,13 0,68±0,12 0,67±0,12

80% Treino 0,92±0,05 0,83±0,15 0,68±0,15 0,64±0,15

A 15: Resultados de CDP da Classe FM_Sunset para modelo fuzzy com FCM clustering.


20% Treino 0,87±0,05 0,55±0,17 0,70±0,11 0,61±0,11

40% Treino 0,92±0,05 0,89±0,05 0,83±0,10 0,63±0,11

60% Treino 0,94±0,03 0,93±0,04 0,91±0,06 0,68±0,11

80% Treino 0,94±0,05 0,93±0,06 0,92±0,07 0,69±0,12

A 16: Resultados de CDP 4SPC da Classe Muito Homogéneo para modelo fuzzy com FCM clustering.


20% Treino 0,74±0,04 0,73±0,05 0,72±0,05 0,71±0,06

40% Treino 0,75±0,04 0,75±0,04 0,74±0,05 0,74±0,05

60% Treino 0,75±0,05 0,76±0,06 0,76±0,06 0,75±0,06

80% Treino 0,75±0,07 0,75±0,07 0,75±0,09 0,76±0,08

A 17: Resultados de CDP da Classe Pouco Homogéneo para modelo fuzzy com FCM clustering.


20% Treino 0,74±0,04 0,74±0,04 0,74±0,04 0,73±0,04

40% Treino 0,76±0,03 0,76±0,03 0,76±0,03 0,75±0,03

60% Treino 0,77±0,03 0,77±0,03 0,77±0,04 0,76±0,03

80% Treino 0,77±0,05 0,77±0,05 0,77±0,05 0,76±0,05

A 18: Resultados de CDP da Classe Nada Homogéneo para modelo fuzzy com FCM clustering.


20% Treino 0,88±0,04 0,87±0,05 0,87±0,05 0,86±0,06

40% Treino 0,90±0,03 0,90±0,03 0,89±0,04 0,89±0,04

60% Treino 0,91±0,03 0,91±0,03 0,90±0,03 0,89±0,04

80% Treino 0,91±0,05 0,91±0,05 0,90±0,04 0,90±0,04

IV

V

Anexo B - Valores quantitativos dos diferentes modelos para a definição dos parâmetros a considerar na modelação dos múltiplos classificadores de cor e textura.

B.1. Definição da percentagem de treino

B 1: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Cor.


20% Treino 0,79±0,14 0,83±0,15 0,85±0,11 0,70±0,14 0,83±0,14 0,76±0,13

40% Treino 0,92±0,07 0,92±0,11 0,95±0,04 0,87±0,10 0,78±0,14 0,88±0,09

60% Treino 0,93±0,06 0,99±0,03 0,96±0,03 0,90±0,07 0,88±0,12 0,91±0,07

80% Treino 0,94±0,06 0,99±0,02 0,97±0,03 0,91±0,07 0,97±0,06 0,92±0,08

B 2: Resultados de CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Cor.


20% Treino 0,91±0,06 0,87±0,10 0,90±0,07 0,84±0,09 0,89±0,08 0,86±0,10

40% Treino 0,95±0,04 0,92±0,06 0,95±0,03 0,90±0,06 0,92±0,05 0,91±0,06

60% Treino 0,95±0,04 0,93±0,05 0,96±0,03 0,92±0,05 0,93±0,04 0,93±0,05

80% Treino 0,95±0,05 0,93±0,07 0,96±0,04 0,93±0,07 0,93±0,06 0,94±0,06

B 3: Resultados de CDP da Regressão Logística para as diferentes percentagens de Treino do conjunto

𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Cor.


20% Treino 0,89±0,05 0,98±0,02 0,93±0,04 0,82±0,07 0,97±0,02 0,85±0,07

40% Treino 0,91±0,04 0,99±0,01 0,94±0,04 0,83±0,06 0,97±0,02 0,89±0,06

60% Treino 0,92±0,05 0,99±0,01 0,94±0,04 0,84±0,08 0,98±0,03 0,89±0,06

80% Treino 0,92±0,07 0,99±0,01 0,94±0,04 0,85±0,10 0,98±0,03 0,90±0,07

B 4: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de Treino

do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Textura.

MH PH NH

20% Treino 0,756±0,075 0,763±0,060 0,899±0,061

40% Treino 0,765±0,059 0,775±0,051 0,912±0,045

60% Treino 0,766±0,064 0,781±0,052 0,916±0,045

80% Treino 0,767±0,088 0,781±0,070 0,918±0,057

B 5: Resultados de CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de

Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Textura.

MH PH NH

20% Treino 0,757±0,075 0,672±0,074 0,902±0,054

40% Treino 0,762±0,063 0,684±0,062 0,912±0,045

60% Treino 0,764±0,068 0,682±0,060 0,916±0,045

80% Treino 0,759±0,089 0,685±0,074 0,917±0,058

VI


𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Textura.

MH PH NH

20% Treino 0,765±0,071 0,629±0,065 0,894±0,059

40% Treino 0,770±0,058 0,634±0,054 0,907±0,045

60% Treino 0,772±0,064 0,634±0,056 0,910±0,045

80% Treino 0,773±0,078 0,634±0,042 0,912±0,049

B 7: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de Treino

do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.


20% Treino 0,78±0,15 0,84±0,15 0,79±0,13 0,71±0,14 0,81±0,15 0,74±0,13

40% Treino 0,92±0,06 0,95±0,09 0,93±0,04 0,88±0,08 0,77±0,14 0,88±0,09

60% Treino 0,94±0,05 0,99±0,01 0,96±0,03 0,90±0,06 0,89±0,12 0,92±0,07

80% Treino 0,94±0,05 1,00±0,01 0,97±0,03 0,91±0,07 0,98±0,05 0,93±0,06

B 8: Resultados CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de Treino

do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.


20% Treino 0,91±0,06 0,89±0,09 0,89±0,07 0,85±0,08 0,88±0,08 0,84±0,09

40% Treino 0,94±0,04 0,93±0,06 0,95±0,04 0,91±0,05 0,92±0,05 0,90±0,07

60% Treino 0,95±0,04 0,95±0,05 0,96±0,03 0,93±0,05 0,93±0,05 0,91±0,06

80% Treino 0,96±0,05 0,94±0,06 0,96±0,04 0,93±0,06 0,93±0,06 0,91±0,07


𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.


20% Treino 0,90±0,04 0,98±0,02 0,92±0,04 0,82±0,07 0,96±0,03 0,83±0,08

40% Treino 0,91±0,04 0,99±0,01 0,93±0,04 0,83±0,07 0,97±0,03 0,87±0,06

60% Treino 0,92±0,04 0,99±0,01 0,93±0,04 0,84±0,08 0,98±0,03 0,88±0,07

80% Treino 0,92±0,06 0,99±0,01 0,93±0,05 0,86±0,10 0,98±0,04 0,89±0,08

B 10: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.

MH PH NH

20% Treino 0,82±0,07 0,8±0,05 0,92±0,05

40% Treino 0,84±0,05 0,8±0,05 0,93±0,04

60% Treino 0,85±0,06 0,81±0,05 0,93±0,04

80% Treino 0,85±0,08 0,81±0,06 0,94±0,05

B 11: Resultados de CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.

MH PH NH

20% Treino 0,82±0,07 0,74±0,07 0,92±0,05

40% Treino 0,83±0,06 0,74±0,06 0,93±0,04

60% Treino 0,84±0,06 0,75±0,07 0,93±0,04

80% Treino 0,84±0,08 0,75±0,08 0,94±0,05

VII

B 12: Resultados de CDP da Regressão Logística para as diferentes percentagens de Treino do

conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.

MH PH NH

20% Treino 0,85±0,06 0,61±0,07 0,92±0,05

40% Treino 0,85±0,05 0,62±0,05 0,93±0,04

60% Treino 0,86±0,06 0,62±0,05 0,94±0,04

80% Treino 0,86±0,08 0,62±0,07 0,94±0,05

B 13: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de

Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.


20% Treino 0,80±0,13 0,84±0,15 0,77±0,13 0,72±0,14 0,82±0,15 0,73±0,14

40% Treino 0,93±0,05 0,94±0,09 0,94±0,05 0,88±0,07 0,81±0,15 0,87±0,07

60% Treino 0,94±0,04 0,99±0,01 0,96±0,03 0,90±0,06 0,89±0,12 0,90±0,06

80% Treino 0,95±0,06 1,00±0,01 0,97±0,03 0,91±0,07 0,98±0,05 0,91±0,07

B 14: Resultados de CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de

Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.


20% Treino 0,91±0,06 0,88±0,09 0,89±0,08 0,85±0,09 0,87±0,08 0,84±0,10

40% Treino 0,94±0,04 0,94±0,06 0,95±0,03 0,91±0,05 0,91±0,05 0,90±0,07

60% Treino 0,95±0,04 0,95±0,05 0,96±0,03 0,92±0,05 0,92±0,05 0,91±0,06

80% Treino 0,95±0,05 0,95±0,06 0,96±0,04 0,93±0,06 0,92±0,06 0,92±0,07


conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.


20% Treino 0,91±0,04 0,97±0,02 0,92±0,04 0,84±0,07 0,96±0,02 0,80±0,09

40% Treino 0,92±0,04 0,98±0,02 0,93±0,04 0,85±0,06 0,97±0,02 0,83±0,07

60% Treino 0,92±0,05 0,99±0,02 0,93±0,04 0,86±0,07 0,98±0,03 0,84±0,08

80% Treino 0,92±0,06 0,99±0,02 0,94±0,04 0,87±0,10 0,98±0,04 0,86±0,10

B 16: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.

MH PH NH

20% Treino 0,79±0,07 0,78±0,06 0,92±0,05

40% Treino 0,8±0,06 0,8±0,05 0,93±0,04

60% Treino 0,81±0,06 0,8±0,05 0,93±0,04

80% Treino 0,81±0,08 0,8±0,06 0,94±0,05

B 17: Resultados de CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.

MH PH NH

20% Treino 0,78±0,07 0,72±0,08 0,91±0,05

40% Treino 0,79±0,06 0,73±0,07 0,93±0,04

60% Treino 0,8±0,06 0,74±0,07 0,93±0,04

80% Treino 0,8±0,08 0,73±0,08 0,93±0,05

VIII


conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.

MH PH NH

20% Treino 0,82±0,06 0,57±0,07 0,92±0,06

40% Treino 0,83±0,05 0,56±0,05 0,93±0,04

60% Treino 0,83±0,06 0,56±0,06 0,94±0,04

80% Treino 0,83±0,08 0,56±0,07 0,94±0,05

B.2. Definição do conjunto de descritores

B 19: Resultados de CDP dos modelos de decisão GK, FCM e RL de classificação de cor com 40% de dados de treino para todas os conjuntos de dados globais


GK 0,78±0,14 0,77±0,14 0,81±0,15

FCM 0,90±0,06 0,90±0,07 0,90±0,07

RL 0,83±0,06 0,83±0,07 0,83±0,07

B 20: Resultados de CDP dos modelos de decisão GK, FCM e RL de classificação de textura com 20% de dados de treino para todas os conjuntos de dados globais


GK 0,76±0,08 0,80±0,07 0,78±0,07

FCM 0,67±0,07 0,74±0,07 0,72±0,08

RL 0,63±0,07 0,61±0,07 0,57±0,07

IX

Anexo C - Classificação das amostras de verificação (98 amostras)

C.1. Classificação nas diferentes Classes de Cor

C 1: Resultado de Classificação para ED_Art_Deco sem erros de classificação.

C 2: Resultado de Classificação para ED_Rosa sem erros de classificação.

X

C 3: Resultado de Classificação para ED_Trovoada sem erros de classificação.

C 4: Resultado de Classificação para ED_Pastel sem erros de classificação.

XI

C 5: Resultado de Classificação para FM_Art_Deco sem erros de classificação.

C 6: Resultado de Classificação para FM_Sunset com erros de classificação assinalados.

C.2. Classificação nas diferentes Classes de Textura

C 7: Resultado de Classificação para Muito Homogéneo com erros de classificação assinalados.

XII

C 8: Resultado de Classificação para Pouco Homogéneo com erros de classificação assinalados.

C 9: Resultado de Classificação para Nada Homogéneo com erros de classificação assinalados.

XIII

Anexo D - Paper aceite no RecPad 2015

XIV

Documents

Classificação Automática de Pedras de Mármore Polidoclassificação, nomeadamente as pedras de mármore. Todo o conhecimento que obtive sobre a indústria dos mármores e em particular