Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Classificação Automática de Pedras de Mármore Polido
João Miguel Pedro Batista
Dissertação para obtenção do Grau de Mestre em
Engenharia Mecânica
Orientadores: Prof. João Rogério Caldas Pinto
Prof. Susana Margarida da Silva Vieira
Júri
Presidente: Prof. Viriato Sérgio de Almeida Semião
Orientador: Prof. João Rogério Caldas Pinto
Vogal: Prof. João Miguel da Costa Sousa
Novembro 2015
i
Agradecimentos
Gostaria, antes de mais, de agradecer aos meus orientadores, Professor Caldas Pinto e à
Professora Susana Vieira, por todo o apoio prestado ao longo deste trabalho, pelo conhecimento
partilhado e pela confiança depositada para esta tarefa desempenhada no âmbito do projeto
UID/SEM/50022/2013 inserido no projeto global QREN “StoneScan” (2013/30369 “Sistema de
Incentivos à Investigação e Desenvolvimento Tecnológico”).
Agradeço também à empresa FrontWave por ter partilhado comigo um dos desafios da empresa,
o que me permitiu desenvolver uma capacidade crítica relacionada com o mundo industrial. Gostaria
também de agradecer à fábrica Grupo Galrão por ter disponibilizado o material para posterior
classificação, nomeadamente as pedras de mármore.
Todo o conhecimento que obtive sobre a indústria dos mármores e em particular a classificação
dos mesmos, devo às longas conversas com os Engenheiros da empresa FrontWave, Adriano Coelho
e Nuno Reis, sem eles não teria sido possível obter uma base de dados com todas as pré-
classificações necessárias ao desenvolvimento deste trabalho.
Quero deixar um especial agradecimento à minha colega de Laboratório Cátia Salgado pelo tempo
que despendeu para me ajudar e por todos os brainstormings construtivos. Sem esta ajuda preciosa
nunca teria conseguido obter estes resultados.
Agradeço aos meus pais pelo apoio e vontade de ajudar ao longo destes últimos meses.
À minha namorada por me dar uma grande ajuda na revisão deste documento, que a obrigou a
ganhar um sentido crítico de uma matéria fora da sua área de conforto, e nos momentos de maior
aflição ajudou-me a descontrair e a focar-me no que era importante. No entanto, para além do
trabalho, foi a pessoa que mais me proporcionou momentos únicos e memoráveis durante estes
últimos meses.
Nesta última fase do trabalho tenho a agradecer à companhia e acolhimento do Laboratório de
Bolhas e Gotas que me ajudaram a focar no objetivo final da entrega da tese.
Por fim, agradeço aos meus amigos que acompanharam todo o meu percurso académico pelos
momentos de descontração e de desabafo.
ii
iii
Resumo
Esta dissertação apresenta um estudo acerca da classificação automática de pedras de mármore
polidas baseadas na sua aparência visual. Este é um problema industrial complexo que até à data
não se conseguiu chegar a uma solução definitiva devido à grande variedade de cores e texturas de
mármores nas diversas geografias. Com a contribuição da empresa FrontWave e da fábrica do Grupo
Galrão foi possível obter um conjunto de amostras de estudo considerável.
Adotou-se uma metodologia baseada em Machine Learning (ML) supervisionado de classificação
com múltiplas classes, seguindo o método de avaliação one-vs-all. Como se tem como objetivo
classificar cores e texturas de mármores, os descritores das imagens foram obtidos através do método
de segmentação QuadTree. Os modelos de classificação aplicados neste trabalho foram: Regressão
Logística (RL) e sistemas fuzzy Takagi-Sugeno (TS) de primeira ordem baseados nos algoritmos de
clustering Gustafson-Kessel (GK) e Fuzzy c-Means (FCM).
Neste trabalho conseguiu obter-se classificações de cor com 3,9% de erro e 25 amostras de treino
para cada classe, e para textura classificações com 16,46% de erro com 30 amostras para treino.
Este último valor de erro, um pouco elevado, justifica-se pela elevada quantidade de mármores em
que os próprios peritos hesitam na atribuição de uma classe. Estes resultados foram obtidos por um
sistema de predição fuzzy TS baseado no algoritmo de clustering GK. Este sistema apresenta uma
cadência de classificação média de 2700 mármores por hora dependendo da homogeneidade da
pedra, visto que o processo mais moroso é o de segmentação de imagem.
Palavras-chave: ML supervisionado, segmentação QuadTree, múltiplas classes, regressão
logística, TS fuzzy models, GK clustering, FCM clustering, classificação automática de mármores.
iv
v
Abstract
This thesis presents a study on the automatic classification of polished marble stones based on
their visual appearance. This is a complex industrial problem that until now has failed to reach a
definitive solution due to the large variety of colors and textures of marbles in different geographies.
With the contribution of the company FrontWave and the factory of Galrão group, it was possible to
obtain a considerable number of study samples.
The methodology used was based on Machine Learning (ML) supervised classification with multiple
classes, followed by the evaluation method one-vs-all. As the final objective is to classify colors and
marble textures, the descriptors of the images were obtained through the Quadtree segmentation
method. The classification models used in this study were: logistic regression (LR) and first order fuzzy
Takagi-Sugeno systems (TS) based on the clustering algorithms of Gustafson-Kessel (GK) and Fuzzy
C-Means (FCM).
In this work one managed to get color classifications with 3,9% error for 25 training samples for
each class, and texture classifications with 16,46% error using 30 samples for training. The latter error
value, which can be considered a little high, is justified by the high amount of marbles in which the
experts themselves hesitate in assigning a class. These results were obtained for TS fuzzy prediction
system based on GK clustering algorithm. This system has an average rate of marble classification of
2700 per hour depending on the homogeneity of the rock due to the fact that the process of the image
segmentation is the most time consuming.
Keywords: ML supervised, QuadTree image segmentation, multi-classification, logistic regression,
TS fuzzy models, GK clustering, FCM clustering, automatic marble classification.
vi
vii
Índice Agradecimentos................................................................................................................................. i
Resumo ........................................................................................................................................... iii
Abstract ............................................................................................................................................ v
Lista de Figuras ............................................................................................................................... xi
Lista de Tabelas ............................................................................................................................. xiii
Nomenclatura ................................................................................................................................. xv
Introdução .................................................................................................................. 1
1.1. Motivação e Contexto ........................................................................................................ 1
1.2. Indústria de mármores em Portugal .................................................................................. 1
1.3. Estado de arte ................................................................................................................... 3
1.4. Objetivos e Contribuições .................................................................................................. 5
1.5. Estrutura ............................................................................................................................ 6
Metodologia de Classificação .................................................................................... 7
2.1. Content-based image retrieval .......................................................................................... 7
2.2. Knowledge Discovery ........................................................................................................ 8
2.2.1. Aquisição e Seleção de Dados .................................................................................. 9
2.2.2. Pré processamento ................................................................................................. 12
2.2.3. Seleção de atributos ................................................................................................ 12
2.2.4. Modelação ............................................................................................................... 14
2.2.5. Avaliação e Interpretação ........................................................................................ 16
Processamento de Imagem ..................................................................................... 19
3.1. Tratamento das amostras ................................................................................................ 19
3.2. Métodos de obtenção de descritores .............................................................................. 21
3.2.1. Descritores de cor.................................................................................................... 21
3.2.2. Descritores de textura ............................................................................................. 22
3.3. Segmentação QuadTree ................................................................................................. 23
3.3.1. Objetivos e metodologia do algoritmo ..................................................................... 23
3.3.2. Características da decomposição ........................................................................... 26
3.4. Definição dos atributos das observações ........................................................................ 27
viii
3.4.1. Atributos de cor considerados ................................................................................. 27
3.4.2. Atributos de textura considerados ........................................................................... 29
3.4.3. Normalização dos vetores de atributos ................................................................... 30
Modelos de Decisão ................................................................................................ 33
4.1. Regressão Logística ........................................................................................................ 33
4.2. Modelos Fuzzy ................................................................................................................. 34
4.2.1. Modelos Fuzzy Takagi-Sugeno ............................................................................... 36
4.3. Clustering ......................................................................................................................... 36
4.3.1. Fuzzy C-Means........................................................................................................ 37
4.3.2. Gustafson-Kessel .................................................................................................... 38
4.4. Múltiplos Classificadores ................................................................................................. 39
Discussão de Resultados ........................................................................................ 41
5.1. Segmentação QuadTree das amostras digitalizadas...................................................... 42
5.2. Procedimento para o cálculo dos índices de desempenho ............................................. 43
5.3. Parametrização dos modelos fuzzy................................................................................. 44
5.3.1. Gustafson Kessel Clustering ................................................................................... 44
5.3.2. Fuzzy C-Means Clustering ...................................................................................... 47
5.4. Model Assessment .......................................................................................................... 48
5.4.1. Avaliação da melhor percentagem de treino ........................................................... 49
5.4.2. Avaliação do melhor conjunto de descritores .......................................................... 52
5.5. Índices de performance dos modelos ............................................................................. 53
5.6. Classificação de novas amostras .................................................................................... 55
5.6.1. Classificação de cor dos conjuntos de amostras de verificação ............................. 56
5.6.2. Classificação de textura dos conjuntos de amostras de verificação ....................... 57
5.6.3. Classificação de cor e textura de amostras não consideradas no estudo dos modelos
de decisão 59
Conclusões e Trabalho Futuro ................................................................................ 63
Anexo A - Valores quantitativos dos diferentes métodos de clustering para a definição da
quantidade de clusters a considerar para os múltiplos classificadores. ............................................. I
A.1. GK clustering. ................................................................................................................. I
A.2. FCM clustering............................................................................................................... II
ix
Anexo B - Valores quantitativos dos diferentes modelos para a definição dos parâmetros a
considerar na modelação dos múltiplos classificadores de cor e textura. ....................................... V
B.1. Definição da percentagem de treino............................................................................. V
B.2. Definição do conjunto de descritores ........................................................................ VIII
Anexo C - Classificação das amostras de verificação (98 amostras) .................................. IX
C.1. Classificação nas diferentes Classes de Cor .............................................................. IX
C.2. Classificação nas diferentes Classes de Textura ........................................................ XI
Anexo D - Paper aceite no RecPad 2015 ........................................................................... XIII
x
xi
Lista de Figuras
Figura 1-1: Diagrama do processo na indústria dos mármores. ...................................................... 2
Figura 2-1: Fluxograma do algoritmo adaptado do CBIR. ............................................................... 8
Figura 2-2: Diagrama do processo do KDD, adaptado de [21]. ....................................................... 9
Figura 2-3: Instrumentação que compõe o protótipo StoneScan da empresa FrontWave. .......... 10
Figura 2-4: Diagrama dos algoritmos de seleção de atributos. a) Feature forward selection; b)
Feature backward selection................................................................................................................. 14
Figura 2-5:Esquema representativo da divisão de dados. ............................................................. 16
Figura 2-6: Representação das diferentes curvas ROC. ............................................................... 18
Figura 3-1: Pré processamento das amostras para n=9................................................................ 20
Figura 3-2: Diagrama do processo de decomposição QuadTree com 3 níveis. ............................ 24
Figura 3-3: Segmentação da amostra com três diferentes critérios de homogeneidade das regiões
e tempos associados a cada uma dessas decomposições. ............................................................... 26
Figura 3-4: Apresentação das regiões predominantes e das venadas. a) Contorno verde
corresponde às regiões predominantes e vermelho às venadas; b) Cores artificiais, verde corresponde
às venadas claras e vermelho às venadas escuras. .......................................................................... 27
Figura 3-5: Histograma dos tons de cinzentos da imagem global. ................................................ 28
Figura 4-1: Resposta da função da regressão logística [54]. ........................................................ 34
Figura 4-2: Configuração do sistema fuzzy, adaptado de [56]. ..................................................... 35
Figura 4-3: Diferenças entre distância Euclidiana (rosa) e Mahalonibis (azul), citado de [56]. ..... 38
Figura 4-4: Diagrama do sistema de classificação de cor e textura. ............................................. 40
Figura 5-1: Estrutura da metodologia para obter resultados de CDP generalizados. ................... 43
Figura 5-2: Resultados de CDP dos classificadores de Cor para método GK clustering com
diferentes clusters e percentagens de treino. a) ED_Art_Deco; b) ED_Rosa; c) ED_Trovoada; d)
ED_Pastel; e) FM_Art_Deco; f)FM_Sunset. ....................................................................................... 45
Figura 5-3: Resultados de CDP dos classificadores de Textura para método GK clustering com
diferentes clusters e percentagens de treino. a) Muito Homogéneo; b) Pouco Homogéneo; c) Nada
Homogéneo. ........................................................................................................................................ 46
xii
Figura 5-4: Resultados de CDP dos classificadores de Cor para método FCM clustering com
diferentes clusters e percentagens de treino. a) ED_Art_Deco; b) ED_Rosa; c) ED_Trovoada; d)
ED_Pastel; e) FM_Art_Deco; f)FM_Sunset. ....................................................................................... 47
Figura 5-5: Resultados de CDP dos classificadores de Textura para método FCM clustering com
diferentes clusters e percentagens de treino. a) Muito Homogéneo; b) Pouco Homogéneo; c) Nada
Homogéneo. ........................................................................................................................................ 48
Figura 5-6: Resultados de CDP dos classificadores de Cor para as diferentes percentagens de
dados de treino consideradas e diferentes modelos de classificação: a) Modelo fuzzy com GK
clustering; b) Modelo fuzzy com FCM clustering; c) Regressão Logística. ........................................ 50
Figura 5-7: Resultados de CDP dos classificadores de Textura para as diferentes percentagens de
dados de treino consideradas e diferentes modelos de classificação: a) Modelo fuzzy com GK
clustering; b) Modelo fuzzy com FCM clustering; c) Regressão Logística. ........................................ 51
Figura 5-8: Resultados das classes com piores valores de CDP dos métodos de classificação com
dados dos três conjuntos de descritores. a) Cor; b) Textura. ............................................................. 52
Figura 5-9: Resultados obtidos dos seis classificadores de cor para 98 novas amostras. ........... 56
Figura 5-10: Resultados obtidos dos três classificadores de textura para 98 novas amostras. .... 58
Figura 5-11: Amostras modelo das diferentes famílias de mármore estudadas. .......................... 59
Figura 5-12: Amostras modelo das diferentes famílias de mármore das amostras rejeitadas. ..... 59
Figura 5-13: Classificação de cor das amostras rejeitadas. a) ED_Art_Deco; b) ED_Rosa; c)
FM_Art_Deco; d) FM_Sunset; e) Indiferenciado. ................................................................................ 61
Figura 5-14: Classificação de textura das amostras rejeitadas. a) Muito Homogéneo; b) Pouco
Homogéneo; c) Nada Homogéneo. ..................................................................................................... 62
xiii
Lista de Tabelas
Tabela 2-1:Características da câmara linear e da câmara monocromática. ................................... 9
Tabela 2-2: Pré classificação das diferentes famílias pelos peritos da fábrica. ............................ 11
Tabela 2-3: Pré classificação das amostras nos três diferentes graus de homogeneidade
considerados. ...................................................................................................................................... 11
Tabela 2-4: Possíveis combinações das classificações reais e preditas. ..................................... 17
Tabela 3-1: Especificações do computador utilizado neste estudo. .............................................. 25
Tabela 3-2: Descritores considerados neste trabalho e valores máximos e mínimos de todas as
observações para cada critério de decomposição considerado na segmentação QuadTree. ........... 30
Tabela 5-1: Resulto da segmentação QuadTree das diferentes classes de textura para os
diferentes critérios de homogeneidade. .............................................................................................. 42
Tabela 5-2: Tempos de processamento da segmentação QuadTree. .......................................... 43
Tabela 5-3: Resultados de CDP do modelo fuzzy GK clustering para o classificador de
ED_Trovoada com a família de descritores 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 ..................................................................... 44
Tabela 5-4: Intervalos de tempo de segmentação para RawData5............................................... 53
Tabela 5-5: Índices de desempenho de GK para RawData5 com 40% de treino para as diferentes
classes de cor. ..................................................................................................................................... 54
Tabela 5-6: Índices de desempenho de FCM para RawData5 com 40% de treino para as diferentes
classes de cor. ..................................................................................................................................... 54
Tabela 5-7: Índices de desempenho de RL para RawData5 com 40% de treino para as diferentes
classes de cor. ..................................................................................................................................... 54
Tabela 5-8: Índices de desempenho de GK para RawData5 com 20% de treino para as diferentes
classes de textura. ............................................................................................................................... 54
Tabela 5-9: Índices de desempenho de FCM para RawData5 com 20% de treino para as diferentes
classes de textura. ............................................................................................................................... 55
Tabela 5-10: Índices de desempenho de RL para RawData5 com 20% de treino para as diferentes
classes de textura. ............................................................................................................................... 55
Tabela 5-11: Resultados de 𝒆𝒑𝒕, 𝑴 para classificação de cor. ...................................................... 57
Tabela 5-12: Resultados de 𝒆𝒑𝒕, 𝑴 para classificação de textura. ................................................ 58
xiv
xv
Nomenclatura
Acrónimos
ACC Accuracy.
AUC Area under the curve.
BRIEF Binary robust invariant elementary features.
BRISK Binary robust invariant scalable key points.
CBIR Content-based image retrieval.
CDP Critério de desempenho ponderado.
FCM Fuzzy c-Means.
FN False negative.
FP False positive.
FPR False positive rate.
GK Gustafson-Kessel.
GLCM Gray-level co-occurrence matrix.
HSV Hue, saturation, value.
KDD Knowledge discovery in database.
ML Machine learning.
OvA One-vs-all.
RGB Red, Green, Blue.
RL Regressão logística.
ROC Receiver-operating characteristic.
SIFT Scale-invariant feature transform .
SPC Specificity.
SURF Speeded-up robust features.
TIFF Tagged image file format.
TN True negative.
TP True positive.
TPR True positive rate.
TS Takagi-Sugeno.
xvi
Símbolos
𝑨𝒈 Matriz simétrica positiva.
𝑨𝒋,𝒌 Conjuntos fuzzy para a regra 𝑗 e atributo 𝑘.
𝒂𝒋 Vetor de parâmetros da função consequente fuzzy da regra 𝑗.
𝒃𝒋 Offset escalar da função consequente fuzzy de regra 𝑗.
𝒅𝒈,𝒏 Distância da amostra 𝑛 ao centro do cluster 𝑔.
𝒆𝒑𝒕,𝑴 Erro de classificação para a percentagem de dados de treino 𝑝𝑡 no modelo 𝑀.
𝒇𝒏 Função de predição da RL.
𝑷𝑪′ Atributo booleano de pertença para a classe 𝐶.
𝑷𝑪 Grau de pertença contínua para a classe 𝐶.
𝑷𝒈 Matriz de covariância do cluster 𝑔.
𝑷𝒊,𝒋 Matriz normalizada de GLCM.
𝑷𝒘,𝒊,𝒋 Valor do pixel do elemento de cor 𝑤 na dimensão 𝑖, 𝑗 da matriz.
𝑺𝒘 Assimetria do elemento de cor 𝑤.
𝒕𝑪 Threshold de pertença para cada classe 𝐶.
𝒗𝒈 Vetor de coordenadas do centro do cluster 𝑔.
𝒙𝒊,𝒋 Valor de intensidade de cor do pixel na dimensão 𝑖, 𝑗 da matriz.
𝒙𝒌𝒎𝒂𝒙 Valor máximo do atributo 𝑘.
𝒙𝒌𝒎𝒊𝒏 Valor mínimo do atributo 𝑘.
𝒙𝒏,𝒌 Valor do atributo 𝑘 da amostra 𝑛.
𝒙𝒏,𝒌𝒏𝒐𝒓𝒎 Valor normalizado do atributo 𝑘 para a amostra 𝑛.
𝑿𝒏 Variável explicativa de RL para cada amostra 𝑛.
𝒚𝒋 Função polinomial do consequente fuzzy para regra 𝑗.
𝒀𝒏 Variável de resposta de RL para cada amostra 𝑛.
𝝆𝒈 Constante de volume do cluster 𝑔.
𝒅𝒊𝒗𝑹𝒆𝒈 Variável lógica de decisão para segmentação.
𝑬 Valor esperado.
𝒆𝒙𝒑𝑺𝒕𝒅 Valor do parâmetro de segmentação.
xvii
𝒇𝒊𝒓𝒔𝒕𝑺𝒆𝒈 Número mínimo de regiões de segmentação de imagem.
𝒊𝒕𝒆𝒓𝒔𝑴𝑨𝟐𝟎_𝟖𝟎 Número de conjugações na seleção de 20% e 80% dos dados de modelação.
𝒊𝒕𝒆𝒓𝒔𝑴𝑨𝟒𝟎_𝟔𝟎 Número de conjugações na seleção de 40% e 60% dos dados de modelação.
𝑱 Número total de regras fuzzy.
𝑲𝒄𝒐𝒏𝒋 Número de conjuntos de dados para modelação/verificação.
𝒎 Grau de fuzziness dos clusters.
𝒎𝒊𝒏𝑨𝒓𝒆𝒂 Área mínima de cada região de imagem.
𝒏_𝒄𝒍𝒂𝒔𝒔𝒆𝒔 Número de classes a considerar.
𝒏_𝒑𝒆𝒓𝒄 Número de percentagens de dados de treino a considerar.
𝑵𝒂 Número total de amostras.
𝑵𝒑 Número de pixeis total.
𝑵𝒓𝒆𝒈𝒊𝒐𝒆𝒔 Número de regiões depois da segmentação.
𝑷𝒄𝒐𝒓(𝒏) Valor de classificação de cor para a amostra 𝑛.
𝑷𝒕𝒆𝒔𝒕(𝒏) Valor de classificação de textura para a amostra 𝑛.
𝒑𝑽𝒆𝒏 Percentagem da área total das venadas na imagem.
𝒑𝑽𝒆𝒏𝑪𝒍𝒂𝒓𝒐 Percentagem da área total das venadas claras na imagem.
𝒑𝑽𝒆𝒏𝑬𝒔𝒄𝒖𝒓𝒐 Percentagem da área total das venadas escuras na imagem.
𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 Conjunto de descritores obtidos da segmentação QuadTree com 𝑒𝑥𝑝𝑆𝑡𝑑 = 3.
𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 Conjunto de descritores obtidos da segmentação QuadTree com 𝑒𝑥𝑝𝑆𝑡𝑑 = 5.
𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟕 Conjunto de descritores obtidos da segmentação QuadTree com 𝑒𝑥𝑝𝑆𝑡𝑑 = 7.
𝒓𝒆𝒈𝑽𝒆𝒏 Variável lógica que define as regiões como venadas.
𝑹𝒑 Número de regiões predominantes.
𝑼 Matriz de partição fuzzy.
𝑽 Vetores de coordenadas dos centros dos clusters.
𝒗𝒂𝒓𝑽𝒄𝒍𝒂𝒓𝒐 Média do brilho das regiões consideradas venadas claras.
𝒗𝒂𝒓𝑽𝒆𝒏𝒂𝒅𝒂𝒔 Grau de percetibilidade da cor das venadas.
𝒗𝒂𝒓𝑽𝒆𝒔𝒄𝒖𝒓𝒐 Média do brilho das regiões consideradas venadas escuras.
xviii
Símbolos gregos
𝜷𝒋 Grau de ativação para a regra 𝑗.
𝜷𝒌 Parâmetros de cada atributo 𝑘 para RL.
𝝁𝑨𝒋𝒌(𝒙) Grau de pertença dos conjuntos fuzzy para a regra 𝑗 e atributo 𝑘.
𝝁𝒈,𝒏 Grau de pertença normalizado da amostra 𝑛 no cluster 𝑔.
𝝁𝒘 Média do elemento de cor 𝑤.
𝝅𝒏 Valor de probabilidade de êxito para RL.
𝝈𝒓 Desvio padrão de intensidade da região 𝑟.
𝝈𝒘 Desvio padrão do elemento de cor 𝑤.
1
Introdução
1.1. Motivação e Contexto
A classificação de pedras de mármore polidas na indústria é uma das fases de produção de
ladrilhos e é nesta fase que os lotes são definidos e posteriormente chegam ao consumidor.
Atualmente essa classificação é realizada por pessoas especialistas que agrupam os ladrilhos por
grau de semelhança de cor, venadas (zonas com elevada discrepância de cor com uma forma fina e
alongada) e manchas (zonas com elevada discrepância de cor com uma forma arredondada), no
entanto a classificação humana introduz um elevado grau de incerteza e inconsistência tendo em
conta a fadiga mental desenvolvida por um trabalhador com este tipo de funções ao longo de várias
repetições na classificação [1].
Esta classificação determina a qualidade do lote em função da aplicação das pedras, como por
exemplo, um cliente que necessite de pedra mármore rosa numa fachada, todos os ladrilhos desse
mesmo lote devem ter a cor predominante desejada para que não haja nenhuma pedra que destoe.
Uma vez que existem vários tipos de mármore provenientes de diversas geografias, não há, ainda,
grupos de classificação definidos de forma universal [2]. Cada pedreira classifica as pedras de acordo
com o tipo disponível para extração. A diferenciação entre pedreiras depende, não só do classificador
mas também do tipo de solo.
O aumento da exigência no design de edifícios impõe que os materiais escolhidos para o
acabamento apresentem uma qualidade visual com nível bastante elevado. A discrepância existente
entre a exigência do cliente e a capacidade de resposta da indústria é cada vez maior, principalmente
devido ao dispêndio de tempo existente para uma correta classificação dos ladrilhos. Identifica-se
então a necessidade de criar um sistema automático que realize esta classificação num menor
intervalo de tempo e com maior grau de fiabilidade. Para isso será necessário ter uma aplicação capaz
de capturar imagens das pedras e classificá-las de forma semelhante à realizada pelos operários
especializados.
Atualmente a área de visão computacional já possui diversos tipos de ferramentas para análise de
imagens que permitem retirar o máximo de informação das pedras e criar uma base de dados de
descritores para diversos tipos de mármores com cores predominantes e homogeneidades diferentes.
Para classificar automaticamente os ladrilhos a partir das características retiradas, é necessário
recorrer a métodos de decisão inteligente para ter uma classificação baseada em dados de treino de
forma a obter um modelo que classifique todas as novas amostras.
1.2. Indústria de mármores em Portugal
A atividade industrial de extração e transformação das rochas calcária e cristalinas em Portugal
está particularmente desenvolvida na designada “Zona dos Mármores”, região interior do Alentejo:
Borba, Estremoz e Vila Viçosa. A recolha, inventariação e o estudo do património e história desta
indústria assume elevada relevância para a realidade local e para o meio rural onde parte destas
2
indústrias se implantou no período entre 1852 e 1986. Neste âmbito foi apresentado em Seminário,
no dia 9 de Janeiro de 2015, em Vila Viçosa, um projeto – PHIM – Património e Historia da Indústria
dos Mármores [3].
O ciclo de produção deste tipo de pedra pode ser descrita em 7 fases, desde o trabalho nas
pedreiras até ao consumidor final, tal como apresentado na Figura 1-1.
Figura 1-1: Diagrama do processo na indústria dos mármores.
A primeira fase é caracterizada pela sondagem de solos e recolha de amostras para análise, com
o objetivo de descrever o material no terreno e posteriormente selecionar quais os terrenos para
extração. De seguida, ainda no terreno de extração (pedreira) extraem-se blocos de pedra perfurando
a rocha em locais específicos para criar uma fenda suficientemente extensa para que se consiga
separar um bloco do tamanho desejado. Com uma serra de mono lâmina ou mono fio a matéria-prima
é cortada em blocos mais pequenos de forma a ser possível o seu transporte para as fábricas.
Na fábrica dá-se inicio á terceira fase, onde os blocos são serrados em chapas com as espessuras
pretendidas. Esta fase utiliza máquinas de corte controladas manualmente e fios de serras rotativas
para transformar um bloco de pedra em chapas. A quarta fase é referente ao corte das chapas
serradas nas diversas medidas existentes. Este processo é elaborado com a máxima precisão para
o maior aproveitamento possível do material e geralmente é uma tarefa executada por uma máquina
de controlo numérico. A estes novos cortes dá-se o nome de ladrilhos e são esses que entram na
fase seguinte, de polimento e calibragem onde a espessura e arestas das pedras são analisadas e
Cliente Final
Mina de Pedra
Produção em SérieTrabalho personalizado
Extração Preparação de transporte
Ladrilhos Controlo de qualidade PolimentoClassificação e armazenamento
3
corrigidas se necessário, não esquecendo de polir um dos lados do ladrilho de forma a ter uma
superfície macia.
Para trabalhos mais elaborados, existe uma outra fase onde se fazem trabalhos específicos e
pormenorizados com uma máquina de corte CNC de 3 eixos ou manualmente por um
especialista/técnico para fazer as geometrias desejadas, formas ou até mesmo esculturas, sendo esta
uma fase da linha de produção intermitente.
A fase de conclusão deste processo é dedicada à embalagem e distribuição dos ladrilhos para o
consumidor final, sendo necessário fazer uma seleção manual dos ladrilhos pela cor e textura e criar
lotes homogéneos para garantir a entrega ao cliente sem qualquer anomalia ou defeito.
Esta classificação manual das pedras é um processo normalmente feito por especialistas através
de comparação com elementos já classificados anteriormente. No caso de existirem duas cores
predominantes, a classificação é feita considerando sempre a cor mais clara. No entanto, caso as
cores sejam muito semelhantes, os operadores classificam para o lote da classe que contém menos
unidades, consoante a procura instantânea do mercado.
1.3. Estado de arte
A otimização de recursos tem sido, nos últimos tempos, um tema bastante discutido na sociedade,
tanto recursos económicos como energéticos e materiais. Neste contexto, o desenvolvimento de
novas tecnologias e em particular a exploração de processos automáticos e inteligentes para os mais
diversos contextos tem tido um crescimento exponencial. Um dos processos que tem ganho, cada
vez mais importância no mundo tecnológico em que vivemos é a classificação automática de imagens,
como por exemplo análise de imagens raio x e outro tipo de imagens médicas [4] ou, num ambiente
mais industrial, a classificação de pedras naturais, como será tratado neste trabalho em que o enfoque
é dado para imagens de mármores.
Quando se pretendem desenvolver sistemas de classificação de imagens em diferentes
categorias, é necessário obter características relevantes das imagens para a distinção das mesmas.
No caso dos mármores, a cor é um fator de relevo e como tal todo o tipo de características globais ou
locais de cor poderão fazer parte da família de descritores. No entanto a preocupação de classificar
os mármores a nível da homogeneidade de cor tem vindo a aumentar cada vez mais. Deste modo
torna-se necessário recorrer a técnicas de decomposição de imagem em regiões de cor homogéneas
e assim retirar caraterísticas de textura.
Em trabalhos anteriores foram considerados diversos tipos de descritores de cor como por
exemplo Erdogan [5] que propõe um método de medição do brilho das pedras, o estudo de Carrino
et al [6] que propõe um sistema automático de visão integrada que se baseia simplesmente na
distribuição de cinzentos de cada mármore ou Cinque el al [7] que utiliza histogramas de diversos
espaços de cor. No entanto existem outros métodos baseados em wavelets e gray-level co-
occurrence matrix (GLCM) para obter descritores de textura e cor como apresentado no trabalho de
Alexandre et al [8], de Luis-Delgado et al [9] e de Sobral [10]. De acordo com os trabalhos de Caldas
4
Pinto et al [11, 12] a decomposição de imagem em diversas regiões homogéneas apresenta
resultados promissores no cálculo de descritores de cor e textura.
A obtenção dos descritores das imagens é uma fase muito importante neste tipo de problemas
dado que qualquer sistema inteligente utilizado para classificar novas amostras, irá recorrer a esses
descritores para obter graus de semelhança. Para um sistema inteligente que classifica novas
amostras de mármore é necessário fazer uma aprendizagem automática, ou machine learning (ML),
que extrai regras e padrões de grandes conjuntos de dados para posteriormente encontrar graus de
semelhança de novas amostras nos conjuntos conhecidos. Esta aprendizagem está relacionada com
data mining e estatística, dado que só é possível criar um sistema suficientemente robusto se os
descritores das imagens forem bem distintivos e se validar estatisticamente o desempenho dos
modelos de classificação criados com diversos conjuntos de dados de treino e teste.
Diversas técnicas de clustering supervisionado, como redes neuronais e modelos fuzzy otimizados
por um algoritmo genético, e não supervisionado, como simulated annealing e fuzzy c-means, foram
testadas por Caldas Pinto et al [13] que concluí que os métodos não supervisionados obtêm
resultados de menor concordância que os outros e é proposto que sejam combinados diferentes
métodos de clustering. Um trabalho consequente, Sousa e Caldas Pinto [14] apresentam, para além
das técnicas de classificação anteriores, a segmentação das imagens com o objetivo de separar as
características das venadas e do fundo da pedra (cor).
Mais tarde, Benavente e Pina [15] propõem uma classificação baseada em metodologias
fundamentadas através de morfologia matemática [16] e defendem que para uma melhor classificação
há a necessidade de segmentar as imagens para uma extração de características locais, o que
melhora a compreensão e detalhe de forma mais concreta a caracterização de ladrilhos de mármore
numa escala macroscópica.
Apesar de todos estes estudos já efetuados, foram poucos os trabalhos implementados em
sistemas industriais, no entanto o investigador Martinez-Cabeza-de-Vaca-Alajarín et al [17] expõe
uma abordagem através de reconhecimento de textura de ladrilhos de mármore com um método
baseado em Sum and Difference Histograms, o que se trata de uma versão mais rápida das Co-
ocorrence Matrices. O método utilizado para classificação é uma rede neuronal que obtêm boas
classificações dos mármores por textura e cores, no entanto apresenta um sistema com um tempo de
processamento elevado e afirma que não foi implementado em sistemas industriais de larga escala
pelo que não foi possível perceber o seu comportamento numa linha de produção em tempo real.
Com a tentativa de tornar este tipo de sistemas de classificação automática como um processo
padrão e aplicável a todos os tipos de fábricas de mármore, Irina Topalova [18] propõe um sistema
automático de classificação de placas de mármore baseado no treino de uma rede neuronal MLP com
três conjuntos de descritores de imagens diferentes: extração de histogramas de textura, Discrete
Cosine Transform (DCT) e Discrete Wavelet Transform (DWT) sobre os histogramas. Neste caso a
investigadora aplicou o sistema de classificação com Programmable Logic Controllers (PLC), uma vez
que a maioria das indústrias é constituída por este tipo de equipamentos, com o objetivo de alcançar
uma operação em tempo real. Conclui então que a utilização de conjuntos de treino DWT e DCT
5
apresentam maior exatidão quando comparados com a aplicação dos histogramas de texturas para
além de oferecerem maior flexibilidade em posterior redução do tempo computacional enquanto é
possível manter a exatidão na classificação.
Apesar dos estudos apresentados nas últimas décadas este é ainda um problema bastante
proeminente na indústria dos mármores uma vez que não existe um sistema comercial padrão que
se consiga utilizar para os diferentes tipos de pedras existentes ao longo da geografia mundial. Neste
trabalho aplicam-se alguns métodos e abordagens já referidos por outros autores com o objetivo de
desenvolver um sistema otimizado, que seja principalmente aplicável às amostras utilizadas em
Portugal.
1.4. Objetivos e Contribuições
Este trabalho tem como principal objetivo criar um sistema de classificação automática de
diferentes tipos de mármores através das diferenças de cor e textura, semelhante ao que já é feito
manualmente na indústria. Com a parceria de uma empresa, FrontWave, podem obter-se as imagens
digitais dos mármores, adquiridas através de um sistema automático de captura de imagem, o
protótipo StoneScan.
Com uma base de dados composta pelas amostras retiradas por este sistema e com uma pré
classificação feita pelos peritos da fábrica, é possível criar modelos de decisão baseados em sistemas
fuzzy e regressões logísticas que consigam classificar novas amostras de mármores de acordo com
a sua cor e homogeneidade. Como existe uma elevada variedade de mármores, e cada fábrica tem
os seus diferentes fornecedores de pedra, adotou-se uma abordagem de múltiplos classificadores
binários para cada classe de cor e textura das amostras cedidas pelo Grupo Galrão.
Os descritores das imagens dos mármores foram extraídos através de um método de
segmentação de imagem em que ao variar os critérios de decomposição de imagem, o desempenho
dos modelos considerados serão avaliados. Para se conseguir uma classificação rápida, a obtenção
dos descritores não pode ser muito demorada, e como tal, tem-se como objetivo o de verificar qual o
critério de decomposição em que os melhores resultados de modelação se obtém, considerando o
tempo de segmentação.
Será necessário também fazer um estudo estatístico para que a escolha dos modelos seja
independente de quais foram os dados escolhidos para treino e teste e concluir quanto à melhor
percentagem de dados de treino. Posteriormente, será simulado um sistema real em que novas
amostras de mármore serão avaliadas pelos modelos para validar os resultados obtidos na
modelação dos mesmos, concluindo assim o método de classificação a utilizar e a quantidade de
amostras que são necessária pré classificar.
Este trabalho contribui com o estudo de um novo sistema de classificação de mármores para a
comunidade de investigação, no entanto visa a ser instalado num sistema de industrial para uma
classificação rápida e precisa de mármores numa determinada fábrica, geografia ou galeria. Como se
adota uma abordagem de múltiplos classificadores, estes resultados poderão ser reproduzidos para
6
qualquer outra galeria, dado que este método cria classificadores para cada tipo de cor ou textura
com dados de todas as classes, seguindo a teoria de one-vs-all.
Para além de este sistema ser versátil, é possível classificar novas amostras como não
pertencentes às famílias existente, o que possibilita criar uma galeria de amostras rejeitadas e, se
houver necessidade, modelar um novo classificador. No entanto, também é possível utilizar este
sistema para responder à necessidade específica de um cliente querer encontrar uma família de
pedras de mármore semelhante a uma amostra pessoal, o que manualmente se torna uma grande
dificuldade.
Com este sistema implementado na indústria será possível criar novos classificadores sempre que
houver necessidade na produção e com uma pequena quantidade de amostras para treino, o que irá
facilitar bastante a pré classificação manual.
1.5. Estrutura
Esta dissertação encontra-se dividida em 6 capítulos, incluindo o presente enquadramento onde
é feita uma introdução à indústria dos mármores em Portugal e onde se apresenta o problema em
foco, contextualizando a relevância desta investigação e a sua contribuição para o estado da arte
atual.
O segundo capítulo apresenta toda a metodologia adotada neste trabalho descrevendo a teoria de
image retrieval e de todos os passos de Knowledge Discovery que consiste na aquisição de imagens,
pré processamento, seleção de atributos, modelação e avaliação. Ainda neste capítulo faz-se uma
descrição do sistema de aquisição de imagem utilizado para criar a base de dados das pedras de
mármore.
De seguida, no capítulo 3 descrevem-se todos os métodos de processamento de imagem
utilizados assim como o algoritmo de segmentação QuadTree para obter os descritores para
classificar os mármores em termos de cor e textura.
No capítulo 4 é apresentada a teoria dos modelos de decisão utilizados, Regressão Logística e
modelos fuzzy baseados em sistemas de inferência Takagi-Sugeno com técnicas de clustering
baseadas nos algoritmos de Gustafson-Kessel e Fuzzy c-Means. Ainda é descrito o método de
classificação de múltiplas classes utilizado.
No penúltimo capítulo são apresentados e discutidos os principais resultados obtidos tendo em
conta os objetivos e o propósito final do trabalho.
Finalmente no sexto e último capítulo apresentam-se as conclusões e propõe-se o trabalho a
desenvolver no futuro.
7
Metodologia de Classificação
Neste capítulo é apresentada a metodologia utilizada para a classificação de mármores de uma
determinada fábrica representativa de toda a sua indústria. Para se conseguir obter resultados
coerentes seguiu-se a metodologia utilizada na técnica Content-based Image Retrieval (CBIR) [19]
em que o processo de definição de padrões de classificação segue a metodologia de Knowledge
Discovery in Database (KDD) [20]. Assim é possível classificar a cor e textura dos mármores com
amostras nunca antes conhecidas através de comparação com a base de dados previamente
desenvolvida.
2.1. Content-based image retrieval
Na última década a quantidade de imagens disponíveis na internet tem vindo a aumentar
drasticamente e muitos motores de busca utilizam as palavras associadas às mesmas para fazer a
pesquisa, sem utilizar qualquer tipo de informação referente às características da imagem. Tornou-se
então necessário utilizar algoritmos que extraem atributos de baixo nível das imagens, como cor,
textura e formas, para procurar similaridades entre imagens [19]. Esta técnica exige a extração de
informação que o espaço de pixéis das imagens disponibiliza e guarda uma base de dados de
atributos definidos por vetores multidimensionais. Assim é possível criar modelos que comparem
novas amostras com as já existentes através dos vetores de atributos.
Com esta tecnologia a pesquisa torna-se muito mais eficiente, deixando de ser necessário ter as
imagens associadas a uma palavra, uma vez que passam a pertencer a uma categoria. Na ótica do
utilizador, o seu trabalho fica bastante facilitado pois a pesquisa torna-se mais vasta e concreta
simultaneamente.
Neste trabalho o universo de informação disponível está restringido pelas pedras que foram
disponibilizadas digitalmente e, como tal, só será possível criar classificadores para esses mesmos
mármores. Na Figura 2-1 encontra-se representado um fluxograma da adaptação do método CBIR
para os objetivos propostos no capítulo 1.
Existem duas fases nesta metodologia que são designadas da seguinte forma:
Conhecimento de dados, 1 – encontra padrões e define modelos de decisão para um
universo de dados com amostras de diversos tipos de mármores. Utiliza a metodologia do
processo de aprendizagem KDD. Com a diversidade de tipos de mármores existentes nas
diferentes fábricas, foi necessário criar classificadores distintos para cada cor e
homogeneidade para que fosse possível dividir os diferentes mármores em classes.
Predição de amostras, 2 – classifica novas amostras através de todos os classificadores
previamente modelados. O objetivo é chegar a uma classificação final que especifique
qual a cor e nível de homogeneidade com um algoritmo de computação simples através
de modelos de decisão com um elevado grau de precisão.
8
Figura 2-1: Fluxograma do algoritmo adaptado do CBIR.
A extração de atributos é explicada no capítulo 3 e é o primeiro processo a considerar para que a
base de dados de atributos seja definida. Neste capítulo serão ainda explicados os processos KDD e
de classificação nas secções 2.2 e 2.3, respetivamente.
2.2. Knowledge Discovery
A quantidade de dados digitalizada para a resolução deste problema foi significativamente grande
e como tal torna-se impossível fazer uma avaliação humana de todos os dados para fazer uma boa
classificação. Todas as amostras retiradas na fábrica foram pré classificadas pelos operadores
especializados, e é com base nessas informações que se desenvolve um novo processo de
classificação, recorrendo a novas técnicas e ferramentas computacionais que se tornaram temas
populares para os investigadores.
De acordo com Fayyad [21], o processo de KDD é bastante útil para criar modelos de decisão para
problemas de classificação. Este método serve para encontrar padrões nos dados que possam ser
utilizados em diversos métodos de modelação e, dado a enorme variedade de escolhas, é necessário
fazer várias repetições até se obter uma boa avaliação dos modelos desejados. Na Figura 2-2 são
apresentados todas as etapas deste processo, tendo como objetivo obter uma base de conhecimento
dos dados.
Base de dados de imagens
Nova imagem
Procura de semelhanças
1 2
KDD Classificação
Modelos guardados
Resultado
Resultado
Base de dados de atributos
Extração de atributos
Procura de semelhanças
1
2
9
Figura 2-2: Diagrama do processo do KDD, adaptado de [21].
No entanto, deve considerar-se que apesar de se ter um procedimento estabelecido, não é
necessário seguir os passos da mesma forma, pode ser possível fazer repetições iterativas de forma
recursiva para algumas das etapas até se obterem resultados satisfatórios. Neste trabalho o método
de KDD serve como referência e de seguida será apresentada a descrição de cada passo.
2.2.1. Aquisição e Seleção de Dados
A obtenção de amostras para este trabalho foi realizada através da instalação StoneScan da
empresa FrontWave e as pedras foram cedidas pela fábrica de mármores do Grupo Galrão com as
suas classificações. Esta instalação é composta por um tapete rolante, duas câmaras e um laser
vermelho em lâmina. As câmaras utilizadas neste protótipo foram:
Câmara monocromática (acA2500-14gm): é composta por um sensor monocromático
com três filtros de cor, que capta a intensidade de luz das cores vermelho, verde e azul.
Isto torna-a especialmente utilizada quando se pretende retirar características de imagem
que disso dependam.
Câmara linear (Spyder3-2K, 18 kHz CL): é composta por duas linhas de filtros de cor,
sendo que a primeira filtra a intensidade de luz para Vermelho e Azul e a segunda só filtra
para a cor Verde. Este, tal como o nome indica, digitaliza uma linha de pixéis a uma
determinada frequência que possa ser compatível com o movimento da amostra no tapete.
Tabela 2-1:Características da câmara linear e da câmara monocromática.
acA2500-14gm Spyder3-2K, 18 kHz CL
Resolução 2592x1944 pixéis 2048 pixéis x2
Taxa de aquisição 14 Hz 18 kHz
Tamanho do píxel 2.2 µm 14 µm
Tipo de Sensor CMOS CCD
Os ladrilhos de mármore são colocados na máquina manualmente e com o movimento constante
do tapete rolante, a amostra passa no feixe de laser, criando um degrau nas suas fronteiras que será
detetado pela câmara monocromática. Com esta informação é possível criar um perfil da pedra,
Dados Dados considerados Dados pré processados Dados reduzidos Procura de padrões Conhecimento
Aquisição e seleção de dados Pré processamento Seleção de atributos Modelação Avaliação e interpretação
10
ficando a saber-se a sua orientação, tamanho e imperfeições no corte do ladrilho. De seguida passa
por um ambiente de luz controlado enquanto digitaliza, com qualidade, a pedra através da câmara
linear orientada a 90º. Com um algoritmo simples consegue-se facilmente recortar a imagem que a
câmara linear digitalizou com o perfil definido pela câmara monocromática. Na Figura 2-3 é
apresentada a máquina criada pela FrontWave, denominada StoneScan, com a demonstração de
toda a instrumentação envolvente.
Figura 2-3: Instrumentação que compõe o protótipo StoneScan da empresa FrontWave.
Com o total de 595 amostras digitalizadas de 11 diferentes tipos de mármores disponíveis, foi
necessário fazer uma pré seleção da base de dados, considerando apenas os 6 tipos de mármores
com mais amostras disponíveis. Estas famílias de mármores selecionadas têm um total de 487
amostras e são denominadas por: ED Art Deco, ED Rosa, ED Trovoada, ED Pastel, FM Art Deco e
FM Sunset.
Neste universo de cores consegue ter-se uma boa perceção da cor, no entanto, há algumas
semelhanças de cor entre elas e poderão ser sujeitas a uma troca devido à subjetividade desta mesma
pré classificação. Pode também verificar-se que dentro de cada família de cor existem diferentes
graus de homogeneidade, caracterizada pela quantidade de venadas existentes na pedra. Atualmente
não existe uma especial preocupação dos peritos pela divisão dos diferentes níveis de
homogeneidade mas como existem clientes mais exigentes ao ponto de pretenderem lotes de
mármores completamente homogéneos, tornou-se necessário fazer uma pré classificação para a
textura. Assim torna-se necessário estudar novos métodos de classificação para satisfazer todos os
clientes.
Esta escolha teve em conta o balanceamento das diferentes famílias de mármores e a existência
de várias texturas. Na Tabela 2-2 são apresentadas as diferentes famílias de mármores selecionadas
Câmara monocromática
Câmara linear
Laser linear vermelho
11
e pré classificadas pelos peritos da fábrica através da sensação de cor e na Tabela 2-3 as diferentes
famílias de textura ou homogeneidade.
Tabela 2-2: Pré classificação das diferentes famílias de cor pelos peritos da fábrica.
ED Art Deco
(70 amostras)
ED Rosa
(87 amostras)
ED Trovoada
(150 amostras)
ED Pastel
(60 amostras)
FM Art Deco
(60 amostras)
FM Sunset
(60 amostras)
Tabela 2-3: Pré classificação das amostras nos três diferentes graus de homogeneidade considerados.
Muito Homogéneo
(98 amostras)
Pouco Homogéneo
(287 amostras)
Nada Homogéneo
(102 amostras)
12
Consegue observar-se através deste pequeno universo que cada família de mármore pode ter
mais do que um nível de homogeneidade. Assim pode constatar-se que a necessidade de criar um
modelo de decisão para textura é efetivamente uma preocupação da indústria. Esta pré classificação
foi mais difícil do que a anterior porque só existem 3 famílias de textura e como existem diversas cores
os peritos afirmam que esta divisão pode sofrer mais alterações na sua classificação.
Para criar modelos de decisão que consigam classificar com um bom desempenho é necessário
criar um conjunto de atributos que consiga efetivamente definir as diferentes cores e texturas. Assim
recorreu-se a métodos de processamento de imagem para se tornar possível extrair as informações
desejadas. No capítulo 3 explica-se com maior detalhe os métodos testados e as características a
utilizar nos modelos de classificação de cor e homogeneidade.
2.2.2. Pré processamento
Esta etapa é essencial quando se está a lidar com um universo de dados de grandes dimensões,
origens diferentes e com muitas variáveis. Assim torna-se difícil criar uma base de dados completa,
com ausência de ruído, sem erros ou até com inexistência de valores de atributos discrepantes e
incompreensíveis [22].
Dado que todas as amostras dos mármores foram obtidas pessoalmente e com rigor, não existem
amostras corrompidas. Foi um processo demorado porque o protótipo StoneScan ainda não estava
totalmente testado e funcional. Como tal algumas digitalizações não eram bem-sucedidas, o que
obrigava a parar a máquina para identificar o problema. Estes erros deviam-se muitas vezes à
dificuldade de traçar o perfil da pedra porque a câmara monocromática podia não identificar com
precisão o desnível do laser. Consecutivamente o processo era repetido com parâmetros diferentes
até se conseguir digitalizar a amostra corretamente.
Como o objetivo de evitar o tipo de erros referido utilizou-se sempre a mesma calibração da câmara
linear, construindo o vetor de atributos da base de dados das imagens com os mesmos parâmetros
de cor, o que resulta de neste trabalho não haver problemas de amostras corrompidas, ruidosas ou
até mesmo discrepantes e incompreensíveis. Com esta base de dados rigorosamente criada, os
atributos extraídos de cada amostra não contêm qualquer tipo de erros que necessite de pré
processamento.
2.2.3. Seleção de atributos
Quando se tem muita informação das amostras torna-se necessário fazer uma seleção das
características para melhorar o tratamento de dados na modelação dos sistemas de decisão. Procura-
se escolher as características que melhor representam os dados para eliminar a redundância das
mesmas. Esta etapa é bastante importante quando se está a lidar com base de dados que contenham
muita informação, o que normalmente acontece devido a geralmente não existir um objetivo concreto
para essa mesma base de dados.
13
Existem duas fases em que estes métodos de seleção podem ser divididos: extração e seleção de
atributos. A extração de atributos tem como objetivo obter novas características a partir dos dados
iniciais e os métodos de seleção definem quais os atributos mais relevantes de forma a definir novos
conjuntos de atributos a partir dos iniciais. A extração de atributos é explicado no capítulo 3, tendo a
base de dado um total de 487 observações referentes a 6 famílias de mármores.
A seleção de atributos serve para reduzir a quantidade dos dados, o que permite beneficiar de um
menor espaço de armazenamento para a informação retirada das amostras e o tempo de
processamento torna-se menor devido à menor dimensão de atributos, facilitando a visualização e
compreensão dos dados [23]. No entanto tem-se um compromisso de preservar a informação para
uma boa classificação e a sua eficiência depende da quantidade de dados do problema. A ideia
principal é encontrar um subconjunto de atributos onde todos sejam relevantes e não-redundantes,
maximizando o critério de avaliação desejado. De acordo com [24], há quatro categorias de seleção
que se baseiam nos seguintes métodos: filtros, wrappers, híbridos e incorporados.
O método que utiliza filtros avalia cada atributo ou combinações de atributos através de medidas
de entropia, redundância ou índices de relevância baseados em coeficientes de correlação entre as
características, sem a necessidade de envolver algoritmos de machine learning (ML) [25]. Com os
atributos ordenados através das diferentes medidas calculadas destacam-se os 𝑘 atributos mais
relevantes para que seja possível agrupar em subconjuntos, descartando os restantes que se
identificam como desnecessários. Este método não obriga a uma grande exigência computacional
mas apresenta algumas lacunas como, por exemplo, a ausência de relação entre o método e o
algoritmo de classificação a utilizar e a escolha da quantidade de atributos.
A metodologia de wrappers envolve os algoritmos ML e como tal torna-se vantajosa em relação
aos filtros por considerar o algoritmo de classificação. Com o critério de avaliação definido, procura-
se perceber qual o melhor subconjunto de atributos que obtém melhores resultados na classificação,
no entanto este é um processo iterativo o que implica um maior dispêndio de tempo quando
comparado com o método de filtros, o que consequentemente exige um maior processamento
computacional.
Para minimizar os problemas destes dois métodos de seleção pode ser criado um método hibrido
que primeiro utiliza os filtros para reduzir o universo de atributos e posteriormente utiliza o algoritmo
wrapper para escolher os mais relevantes de acordo com o critério de seleção dos algoritmos
utilizados no processo ML. Para finalizar os métodos incorporados que utilizam simultaneamente os
processos acima descritos e criam um subconjunto de atributos através da avaliação dos modelos no
processo de treino.
No entanto, o método mais utilizado para a seleção de atributos é o principal component analysis
[26, 27] ou análise de componentes principais. A metodologia deste método passa por 4 passos:
1. Normalização dos atributos;
2. Matriz de covariância;
3. Vetores próprios e valores próprios;
14
4. Escolha das componentes e formação do novo vetor de atributos.
Dos atributos obtidos para cada amostra, é necessário fazer uma normalização dos dados para
que cada vetor de atributo possua uma média nula (diferença do valor de cada observação com a
média do atributo). De seguida é necessário calcular uma matriz de covariância para ser possível
extrair vetores e valores próprios dos dados. Observando para os resultados obtidos, o vetor próprio
que contem o maior valor próprio é considerado a componente principal. Para a escolha das
componentes que melhor caracterizam os dados é necessário ordenar por ordem decrescente os
valores próprios dos respetivos vetores próprios. Assim escolhem-se os vetores com os valores
próprios maiores e rejeitam-se os seguintes que são menos significantes de forma a não perder muita
informação dos dados iniciais.
Existe também a possibilidade de fazer uma seleção de atributos através de uma análise
estatística dos índices de desempenho dos modelos para diferentes combinações de atributos
escolhidas de duas formas, forward selection e backward selection [23]. A grande diferença entre
estes dois métodos é a inicialização da escolha, sendo que na opção de forward selection se procura
a melhor combinação de atributos começando com um atributo e adiciona-se sucessivamente novos
atributos Figura 2-4 a). Este método tende a produzir subconjuntos com menos atributos e tem a
capacidade de eliminar os atributos redundantes. No backward selection inicializa-se o processo com
todos os atributos e vai-se removendo sucessivamente até se obter o melhor subconjunto Figura 2-4
b). Este método produz melhores resultados em termos de precisão mas por outro lado requere uma
grande exigência computacional.
Figura 2-4: Diagrama dos algoritmos de seleção de atributos. a) Feature forward selection; b) Feature backward selection.
Neste trabalho as amostras foram obtidas já com o propósito de criar múltiplos classificadores
através de modelos de decisão para diferentes famílias de cor e textura. Os atributos obtidos das
imagens foram cuidadosamente escolhidos para representar da melhor forma a informação
necessária. Considera-se então todas as características retiradas das imagens para treinar os
modelos de decisão e posteriormente prever a sua classificação.
2.2.4. Modelação
Com o conjunto de observações e atributos já definido, a fase de modelação tem como objetivo
encontrar relações entre os atributos para que seja possível definir regras de classificação. Existem
diversos métodos que podem ser aplicados para criar modelos, no entanto aqueles que melhor se
a)
…
…
…
b)
…
… … …
… … …
15
adaptam a um problema desta natureza são baseados em ML, reconhecimento de padrões e
estatística, como classificação, clustering ou regressão.
Na utilização de ML não supervisionada o grande objetivo é encontrar na estrutura total dos dados
um padrão para a definição de diferentes grupos, de acordo com as suas semelhanças. Este é um
problema complexo dado que não existe nenhum critério de comparação que seja globalmente aceite,
uma vez que a classificação do resultado obtido é subjetiva à interpretação do utilizador [28].
Para ML supervisionada cada observação necessita de ter uma pré classificação com o objetivo
de criar padrões entre os atributos para cada classe especificada [29]. Neste trabalho adotou-se esta
abordagem para múltiplas classes de modo a que os resultados obtidos sejam representativos para
outros conjuntos de amostras. A estratégia utilizada para os diferentes classificadores binários é
denominada de “one-vs-all” (OvA) que se caracteriza pelo treino de classificadores únicos para cada
família, em que as amostras pré classificadas dessa mesma família são positivas e as restantes
amostras negativas, o que resulta de um treino de conjuntos de dados desbalanceados para cada
classificador.
Assim, para cada conjunto de dados, realiza-se uma divisão em dois subconjuntos:
treino/validação e teste. Com os dados de treino/validação, ou de modelação, é possível avaliar os
modelos através de índices de desempenho e, devido à quantidade de iterações necessárias para se
concluir qual o melhor modelo, torna este processo de aprendizagem demorado [29]. No entanto, os
dados de teste servem para fazer a classificação dos mármores através dos múltiplos classificadores
binários que representam os melhores critérios de desempenho na modelação e concluir quanto à
validade dos resultados obtidos através da percentagem de erro de classificação.
Os dados de teste foram selecionados de uma forma aleatória com 20% do total de dados para
cada classe. De forma a variar a semente que gera os valores pseudoaleatórios de seleção das
amostras, este processo foi repetido 5 vezes, originando 5 subconjuntos diferentes de teste (𝐾𝑐𝑜𝑛𝑗)
com aproximadamente 98 amostras. Assim, cada conjunto de modelação corresponde a 80% do total
de dados para cada classe.
Uma vez que se têm diferentes formas de selecionar os dados de modelação, torna-se necessário
dividi-los em grupos de dados de treino com diferentes percentagens para estudar o impacto que a
quantidade de amostras de treino têm nos modelos de decisão. Para avaliar a capacidade de
generalização de um modelo a partir de um conjunto de dados, em que o objetivo da modelação é a
predição, adotou-se a técnica de validação cruzada [30] com o método 5-fold para dividir os dados de
modelação em dois subconjuntos mutuamente exclusivos, treino (estimação dos parâmetros) e
validação. Com diferentes combinações de seleção de dados, torna-se possível definir subconjuntos
de treino com diferentes percentagens de treino, 20%, 40%, 60% e 80%, dos dados de modelação, o
que equivale a 80, 160, 240 e 320 amostras, respetivamente. Este processo foi repetido 10 vezes
para a semente que gera os valores pseudoaleatórios de seleção das amostras seja variada. Na
Figura 2-5 pode observar-se um diagrama representativo da divisão total dos dados.
16
Figura 2-5:Esquema representativo da divisão de dados.
Como se pode verificar existem cinco formas diferentes de selecionar dados que contêm 20% e
80% dos dados de modelação (𝑖𝑡𝑒𝑟𝑠𝑀𝐴20_80) e dez para 40% e 60%, (𝑖𝑡𝑒𝑟𝑠𝑀𝐴40_60). A necessidade
de seguir este método deve-se ao facto de este trabalho se propor a um estudo da quantidade de
amostras necessárias para a estimação dos parâmetros dos modelos.
2.2.5. Avaliação e Interpretação
Este é o último passo do processo KDD e é crucial para todo o processo de aprendizagem, uma
vez que é através deste processo que se avalia o desempenho dos modelos criados dependendo da
quantidade de dados de treino utilizados. Os modelos de decisão testados neste trabalho são:
Regressão Logística (RL) e modelos fuzzy com sistemas de inferência Takagi-Sugeno (TS) baseados
nos métodos de clustering Gustafson-Kessel (GK) e Fuzzy c-Means (FCM), explicados em pormenor
no capítulo 4.
Para se compreender o cálculo dos índices de desempenho dos modelos é necessário ter em
consideração que para classificar múltiplas classes através de classificadores binários, cada amostra
só pode ter uma classe de cor e textura real. Assim a classificação predita de cada modelo toma
valores lógicos (0 ou 1), no entanto é necessário que a resposta contínua dos classificadores seja
comparada com o threshold definido através dos dados de treino, o que define a fronteira de pertença.
Tendo em conta a combinação das classificações reais (pré classificação) e preditivas (resposta
dos modelos), quatro diferentes possibilidades podem ser consideradas (Tabela 2-4), também
conhecida como matriz de confusão [31].
M2 M3 M4 M5M1
M1 M2 M3 M4 M5
M2 M1 M3 M4 M5
M3 M2M1 M4 M5
M4 M2 M3M1 M5
M5 M2 M3 M4M1
20% 80%
M2M1
M1 M3
M1 M4
M1 M5
M2 M3
M2 M4
M2 M5
M3 M4
M3 M5
M4 M5
40%
M3 M4 M5
M2 M4 M5
M2 M3 M5
M2 M3 M4
M1 M4 M5
M1 M3 M5
M1 M3 M4
M2M1 M5
M2M1 M4
M2 M3M1
60%
Total dos dados (487 Amostras)
Teste
20% 80%
Modelação
=
5 runs
10 runs
17
Tabela 2-4: Possíveis combinações das classificações reais e preditas.
Classe Predita
Positivo Negativo
Classe Real
Positivo True Positive (TP) False Negative (FN)
Negativo False Positive (FP) True Negative (TN)
Esta tabela é preenchida pelas amostras testadas nos modelos treinados e o total de amostras
alocadas em cada possibilidade de classificação tem de ser igual à quantidade de amostras testadas.
Assim pode definir-se que TP corresponde às amostras que foram bem classificadas na classe
positiva, FP às amostras que foram mal classificadas na classe positiva, FN às amostras que foram
mal classificadas como classe negativa e TN às amostras que foram bem classificadas na classe
negativa.
O cálculo dos índices de desempenho é realizado com base na divisão realizada através da matriz
de confusão e são considerados os seguintes índices de desempenho:
Sensitivity, ou true positive rate (TPR), mede a quantidade de amostras positivas que
foram corretamente classificadas:
𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 = 𝑇𝑃𝑅 =𝑇𝑃
𝑇𝑃+𝐹𝑁 (2.1)
Specificity (SPC), ou true negative rate, mede a quantidade de amostras negativas que
foram corretamente classificadas:
𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦 = 𝑆𝑃𝐶 =𝑇𝑁
𝑇𝑁+𝐹𝑃 (2.2)
Fall-out, ou false positive rate (FPR), mede a quantidade de amostras positivas que foram
incorretamente classificadas:
𝐹𝑃𝑅 = 1 − 𝑆𝑃𝐶 (2.3)
Accuracy (ACC) mede a proporção de classificações corretas sobre o total de
observações:
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝐴𝐶𝐶 =𝑇𝑁+𝑇𝑃
𝑇𝑁+𝑇𝑃+𝐹𝑃+𝐹𝑁 (2.4)
Com as medidas de desempenho introduzidas é possível representar a receiver-operating
characteristic (ROC) que possibilita a obtenção de um novo índice, designado de area under the ROC
curve (AUC) [32], muito utilizado para avaliar classificadores em diversos problemas [33, 34, 35]. A
curva ROC é traçada com os valores obtidos de TPR (2.1) na abcissa e FPR (2.3) na ordenada,
variando o threshold de pertence entre 0 e 1, Figura 2-6.
18
Figura 2-6: Representação das diferentes curvas ROC.
O índice AUC é calculado pela integração da curva ROC para todos os thresholds, conseguindo
obter valores entre 0 e 1 para este índice, em que entre 0 e 0,5 sugere-se que se altere as classes
porque apresenta melhores resultados para o problema inverso, 0,5 é corresponde a um modelo sem
valor e 1 corresponde a um modelo ideal, impossível de se obter em problemas reais. Este índice de
desempenho é útil quando se está a lidar com problemas onde se torna difícil a especificação do
threshold de pertença.
Como o problema que se trata neste trabalho necessita que os modelos consigam prever com
bom desempenho as amostras positivas ou negativas, verificou-se a necessidade de criar um critério
de desempenho ponderado (CDP) em que os índices de TPR e SPC serão conjugados (equação 2.5).
Existe uma elevada preocupação em criar lotes de mármores homogéneos, ou seja, as amostras
positivas serem classificadas corretamente (TPR) e as amostras que foram corretamente
classificadas como negativas (SPC) são os fatores mais importantes devido ao custo real associado
destas mesmas decisões. No entanto, o custo ao classificar amostras positivas incorretamente é um
fator a considerar, como tal os índices de ponderação de TPR e SPC não podem ser muito
discrepantes.
𝐶𝑟𝑖𝑡é𝑟𝑖𝑜 𝑑𝑒 𝐷𝑒𝑠𝑒𝑚𝑝𝑒𝑛ℎ𝑜 = 𝐶𝐷𝑃 = 0,6𝑇𝑃𝑅 + 0,4𝑆𝑃𝐶 (2.5)
Assim torna-se possível avaliar os modelos através deste critério de desempenho que vai ao
encontro dos custos de seleção reais, e assim tomar decisões quanto à estimação dos parâmetros
dos modelos.
Modelo Ideal Modelo Real Modelo Sem Valor
19
Processamento de Imagem
Uma imagem é representada em termos computacionais como um array, ou matriz, composta por
pixéis quadrados dispostos em linhas e colunas. Uma imagem de “cor verdadeira” tem uma
intensidade de cor de 24 bits, o que equivale a 3 componentes, RGB (red, green e blue), com 8 bits
cada elemento e podem obter valores entre 0 e 256, logo cada imagem poderá representar cerca de
16,7 milhões de cores [36]. As amostras utilizadas neste trabalho foram digitalizadas pelo protótipo
StoneScan da empresa FrontWave sempre com a mesma calibração de cores para não haver
discrepâncias significativas. Esta digitalização resulta num conjunto de ficheiros TIFF (Tagged Image
File Format), formato padrão para imagens com 24 bits de intensidade de cor.
As imagens a processar são divididas num conjunto de células discretas pequenas, conhecidas
como pixéis. Cada píxel tem uma forma quadrangular e a quantidade de pixéis existentes na imagem
é o que define as suas dimensões digitais. Posteriormente à divisão obtém-se uma matriz em que
cada célula é definida por uma só cor, ou seja, qualquer variação de cor da imagem real nessa
pequena área é perdida. Se a área de cada píxel for muito pequena, então para um humano tornasse
invisível esta divisão. Este conjunto de células irá constituir uma matriz 3D no espaço de cores, sendo
que cada píxel contem informação das três componentes da imagem real em formato digital em
termos de intensidade de cor RGB.
Neste capítulo será descrito todo o processo de digitalização e pré processamento das imagens
dos mármores e serão apresentados os atributos, descritores das imagens, extraídos para a
classificação pretendida. O método considerado para a extração desses descritores será descrito em
pormenor uma vez que validará a informação retirada das amostras. Finalmente serão enumerados
os descritores que irão construir os atributos na base de dados tal como a normalização efetuada.
3.1. Tratamento das amostras
As amostras digitalizadas foram analisadas e na sua maioria observa-se que não contêm apenas
a informação da pedra, sendo possível identificar nas margens da imagem parte do tapete rolante
onde se encontram depositadas as lajes para digitalização. Este “defeito” na imagem sucede-se
devido a problemas de calibração do corte da imagem digitalizada. Foi então necessário melhorar o
corte das imagens e normalizar as dimensões de forma a obter-se um número igual de pixéis para
todas as imagens.
Para realizar o pré-processamento referido construiu-se um algoritmo em Matlab em que se
recorre a distinção entre os pretos do tapete e a cor das pedras, no entanto foi necessário proceder-
se a uma transformação dos sistema de cores RGB para HSV [37], formado pelas componentes Hue,
Saturation e Value. Este sistema de cores define o espaço de cor através de H ou tonalidade que
verifica o tipo de cor, abrangendo todas as cores do espectro, S ou saturação que verifica o tom de
cinza da imagem, e V ou brilho que define o grau de claridade da cor.
Este algoritmo calcula a média do brilho para cada conjunto de pixéis referentes às primeiras e
ultimas 50 linhas e colunas, o que garante somente a análise das fronteiras do mármore que poderão
20
ser necessárias eliminar. Foi necessário fixar um limite da média e com diversos testes observou-se
que se a média de V for menor que 0,4 é porque se refere a informação do tapete que terá de ser
eliminada. Contudo ainda é necessário normalizar as dimensões das amostras para que todas
contenham a mesma quantidade de pixéis, dado que as imagens originais têm dimensões que podem
variar entre 980x980, dependendo da qualidade da digitalização. Como as amostras são quadradas
sugeriu-se verificar qual das dimensões da imagem digitalizada é menor para eliminar pixéis dos
limites da outra dimensão para que a imagem digital corresponda à amostra real e não perca nenhuma
informação relevante.
Uma vez que não existe necessidade de processar imagens com uma dimensão elevada, até
porque o tempo computacional é mais elevado, recorreu-se a um redimensionamento baseado na
interpolação bicúbica para regiões de 4x4 pixéis [38]. Este método faz com que os pixéis da nova
imagem contenham um conteúdo visual semelhante à original porque se realiza uma transição suave
entre as cores do primeiro plano e do plano de fundo. Esta interpolação calcula uma média ponderada
entre cada píxel e os seus vizinhos nas três direções (horizontal, vertical e diagonal) e preenche um
novo píxel entre eles no caso de ampliação da imagem original. Neste caso o objetivo será o de
reduzir as dimensões das imagens e como tal os pixéis que foram eliminados serão substituídos por
novos, da mesma forma que no caso de ampliação. Assim é possível reduzir as amostras iniciais para
uma dimensão na base logarítmica de dois, 2n, sendo n=9 (512x512) as dimensões adequadas às
imagens de trabalho. A Figura 3-1 apresenta os resultados das etapas descritas para uma amostra
típica de dimensão original de 985x983.
Imagem Inicial
Transformação HSV
Corte da Imagem
Redimensionamento para 2n
Figura 3-1: Pré processamento das amostras para n=9.
21
O resultado obtido deste pré processamento não altera a informação dos mármores digitalizados
em termos de cores e texturas. As amostras ficam assim redimensionadas e normalizadas para uma
nova dimensão, formando um quadrado perfeito, com um total de 262144 pixéis.
3.2. Métodos de obtenção de descritores
Existe a necessidade de caracterizar de forma quantitativa um objeto numa imagem sendo que,
para tal, as características de imagem – cor e textura – são representadas por um vetor de escalares,
designado de descritor de imagem. Esse descritor corresponde a um ponto no espaço Rn. É dada
grande importância a que todos os descritores sejam invariantes a transformações. No entanto, a
complexidade destes descritores, ou assinaturas como às vezes são chamados, implica que possam
ser necessárias funções mais complexas de distância do que uma simples métrica Euclideana para
se poder efetuar comparações de qualidade. Existem descritores de alto nível e de baixo nível. Os
descritores de alto nível representam de uma forma mais abstrata as características das imagens
globais e os descritores de baixo nível representam informações mais específicas e referentes a
regiões ou até mesmo a pixéis da imagem.
Nas últimas duas década desenvolveram-se novas formas para obter descritores que se baseiam
em pontos de interesse das imagens como os métodos scale invariante feature transform (SIFT) e
speeded-up robust features (SURF). Estes dois métodos baseiam-se na orientação do gradiente de
imagem, diferindo apenas na deteção dos pontos de interesse e são métodos invariantes à escala,
translação e rotação da imagem [39, 40, 41]. Possuem um grande potencial para problemas como
reconhecimento facial, biometria e reconhecimento de padrões. Existem também métodos binários,
como o binary robust invariant and elementary feature (BRIEF) e binary robust invariant scalable key
points (BRISK) que através de funções de comparação de intensidade de pixéis, criam vetores
binários para criar regiões ou pontos de interesse [42, 43].
Uma vez que neste trabalho se analisa e classifica os diferentes tipos de mármores existentes
numa fábrica de acordo com a sua cor e textura e a sua digitalização é feita com as condições de
luminosidade e translação constantes, não se considerou necessário aplicar estes métodos mais
recentes que utilizam pontos de interesse. Existem métodos de segmentação de imagem em que o
critério de divisão pode ser definido por homogeneidade ou variação de cor, sendo possível ter
descritores das regiões resultantes. Assim considerou-se a segmentação QuadTree tal como feito
num trabalho anterior [12] e será apresentada na secção 3.3 deste capítulo. Descritores de frequência
ou regiões de cores predominantes são muito importantes devido ao fator humano que usa a cor
como forma de categorização. Deste modo estes métodos de segmentação da imagem são bastantes
utilizados quando se trata de imagens naturais, dado que a decomposição tem em conta a variação
de cor.
3.2.1. Descritores de cor
A cor é a primeira característica visual que se considera para CBIR porque é o fator mais
importante na perceção visual humana. A cor é uma perceção visual da reflexão das ondas de
22
frequência eletromagnética nos objetos e está relacionada com os diferentes comprimentos de onda
do espectro. O ser humano só consegue ver uma pequena faixa do espectro de frequências,
designado de faixa visível, contida entre 370𝑛𝑚 (violeta) e 750𝑛𝑚 (vermelho) do espectro
eletromagnético [44]. Em termos computacionais, é possível representar esta sensação de cor através
de diversos sistemas de cor digitais e é necessário ter em consideração qual o que melhor se adequa
à realidade. De seguida são enumerados alguns espaços de cor em que as imagens originais poderão
ser transformadas para uma melhor perceção da sensação de “cor verdadeira” [45]:
RGB representação das cores vermelho, verde e azul;
HSV representação da tonalidade, saturação e brilho das cores;
CMY representação das cores ciano, magenta e amarelo;
CMYK representação das cores ciano, magenta, amarelo e preto;
No caso da classificação de pedras naturais verificou-se que os espaços de cor que melhor
caracterizam as imagens são o RGB, cores reais, e o HSV, perceção dessas mesmas cores [46]. Os
atributos de cor mais utilizados no método CBIR são os momentos, histogramas e vetores de
coerência de cor [47].
Existem 3 momentos de cor que podem ser calculados para cada elemento no espaço de cor
utilizada, como por exemplo o espaço RGB contem 3 canais diferentes de cor. De seguida são
apresentados os diferentes momentos de cor a calcular:
Média: µ𝑤 =1
𝑁𝑝 . ∑ ∑ 𝑝𝑤,𝑖𝑗
𝑗𝑗=1
𝑖𝑖=1 (3.1)
Desvio padrão: 𝜎𝑤 = √(1
𝑁𝑝 . ∑ ∑ (𝑝𝑤,𝑖𝑗 − µ𝑤)
2𝑗𝑗=1
𝑖𝑖=1 ) (3.2)
Assimetria: 𝑠𝑤 = √(1
𝑁𝑝 . ∑ ∑ (𝑝𝑤,𝑖𝑗 − µ𝑤)
3𝑗𝑗=1
𝑖𝑖=1 )
3 (3.3)
sendo que 𝑁𝑝 é o número de pixéis da imagem e 𝑝𝑤,𝑖𝑗 o valor do píxel na linha 𝑖 e coluna 𝑗 da imagem
na dimensão 𝑤 de cor.
Um histograma de cor representa a distribuição das cores de que uma imagem se compõe e
podem retirar-se diversas informações que poderão ser parâmetros distintivos dos diferentes tipos de
mármores a classificar. É possível perceber qual é a distribuição de cores na imagem global, no
entanto não contêm qualquer tipo de informação da localização dos pixéis com determinadas
características. Como tal existe um descritor que pode ser calculado, que introduz a noção espacial
desses pixéis, o vetor de coerência [48]. Para cada cor existente na imagem haverá um valor que diz
se a cor é coerente ou não, caracterizado por manchas de pixéis iguais. Este valor compõe um novo
vetor onde se tem a informação de quais as cores que mais se notam na imagem através da
proximidade desses mesmos pixéis.
3.2.2. Descritores de textura
Quando se refere a textura um dos conceitos diretamente relacionado é o conceito de
homogeneidade, pois a ideia de textura tem em consideração a variação de cores e as suas
23
transições. Quando se trata de diferenciar pedras naturais este fator torna-se ainda mais importante
na medida em que permite ter uma ideia do nível de grão da pedra. Os descritores de textura ao
serem considerados disponibilizam informação de regularidade, suavidade e rugosidade das pedras.
O método mais usado para a obtenção deste tipo de descritores baseia-se no gray level co-
occurence matrix (GLCM) [49] que se caracteriza como sendo uma matriz de ocorrências de
combinações diferentes de valores de pixéis de brilho (tons cinza ou gray level) que ocorrem numa
imagem. Este método foi inicialmente apresentado por Haralick em 1973 e como tal denomina-se de
descritores de Haralick [50]. Assim é possivel enumerar algum dos descritores que são calculados
através deste método:
Contraste: ∑ 𝑃𝑖,𝑗. (𝑖 − 𝑗)2𝑁𝑝−1𝑖,𝑗=0 (3.4)
Dissemelhança: ∑ 𝑃𝑖,𝑗. |𝑖 − 𝑗|𝑁𝑝−1𝑖,𝑗=0 (3.5)
Homogeneidade: ∑𝑃𝑖,𝑗
1+(𝑖+𝑗)2
𝑁𝑝−1𝑖,𝑗=0 (3.6)
Energia: √∑ 𝑃𝑖,𝑗2𝑁𝑝−1
𝑖,𝑗=0 (3.7)
Entropia: ∑ 𝑃𝑖,𝑗. (− ln 𝑃𝑖,𝑗)𝑁𝑝−1𝑖,𝑗=0 (3.8)
em que 𝑃𝑖,𝑗 é o valor normalizado da GLCM da linha i e coluna j da imagem.
Em termos estatísticos podem definir-se mínimos, máximos, médias e desvios padrões da GLCM,
que também poderão pertencer à família de descritores de textura. Para criar a matriz de co-
ocorrência é necessário ter em atenção diversos parâmetros como por exemplo a direção em que
procura as combinações de pixéis, o tamanho das regiões dessas mesmas combinações e até mesmo
a gama dos níveis de cinzento a considerar. Como tal este método não é o mais aconselhado para
um descritor de textura global que se possa considerar para todos os tipos de mármores.
3.3. Segmentação QuadTree
A segmentação QuadTree [51, 52] é utilizada para decompor uma imagem não homogénea em
regiões, e necessita que a amostra de entrada tenha dimensões quadráticas na base logarítmica de
dois, 2n, sendo n um número inteiro positivo. Esta condição já foi satisfeita com o pré processamento
das imagens, introduzida na seção 3.1 deste documento, em que as dimensões foram normalizadas
para 512x512 pixéis.
3.3.1. Objetivos e metodologia do algoritmo
O objetivo da segmentação de texturas é dividir a imagem em regiões homogêneas de acordo com
a informação de textura presente em cada uma. O principal obstáculo de implementação deste
método é a necessidade de escolha de um conjunto de características e medidas para descrever e
diferenciar as regiões. Um conjunto com poucas características pode não diferenciar texturas
parecidas de forma satisfatória e, por outro lado, características demais podem fazer com que texturas
24
visualmente parecidas sejam consideradas como texturas diferentes, causando sobre segmentação
na imagem. Uma vez que neste trabalho só se tratam amostras de pedras de mármore polidas
considerou-se como critério de decomposição de regiões o desvio padrão da intensidade de cor.
Como se trata de um algoritmo do tipo split-and-merge [49], pode dividir-se em duas partes: a
primeira é responsável por decompor a imagem em regiões de textura homogénea, definindo as
fronteiras dessas mesmas regiões utilizando a decomposição QuadTree. A segunda parte pode ser
vista como um passo de pós-processamento, que procura encontrar semelhanças entre as regiões
descritas e agrupá-las sob uma mesma região.
A decomposição inicializa com uma primeira divisão da imagem em 4 regiões quadradas. As
imagens a processar têm dimensões quadráticas na base logarítmica de 2 e é possível dividir toda a
imagem em regiões quadradas até se obter regiões que contenham somente um píxel. Para evitar a
decomposição da imagem a este extremo, definiu-se como critério de paragem um número mínimo
de pixéis por região igual a 4.
Figura 3-2: Diagrama do processo de decomposição QuadTree com 3 níveis.
Dado que as imagens de entrada têm dimensões quadradas de 29, 512 pixéis, e o critério de
dimensão mínima é de 22, 4 pixéis, é possível chegar a um máximo de oito subdivisões de regiões.
Na Figura 3-2 apresenta-se um esquema com três subdivisões representativas do processo de
decomposição.
Os passos deste algoritmo podem ser descritos da seguinte forma:
1. A imagem de entrada é subdividida em quatro regiões quadradas;
2. Os pixéis de cada bloco são testados em relação ao critério de homogeneidade;
3. Se o critério não é satisfeito, o bloco é novamente subdividido em quatro;
4. Este processo repete-se até que todas as regiões atendam ao critério de homogeneidade
ou ao tamanho mínimo estabelecido. A imagem resultante pode conter regiões de
tamanhos diferentes.
25
Como este processo visa decompor as amostras em diversos blocos, ou regiões, conforme a sua
homogeneidade, foi feita uma transformação do espaço de cores original, RGB, para intensidade, ou
tons de cinzento [36]. Esta transformação preserva toda a informação referente à textura e assim
simplifica-se o processo de segmentação, dado que cada imagem passa a ser representada por uma
dimensão.
O critério de homogeneidade que define a divisão de cada região, 𝑟, foi baseado no desvio padrão
de intensidade.
𝜎𝑟 = √1
𝑁𝑝 ∑ ∑ (𝑥𝑖𝑗 − µ𝑟)
2𝑗𝑗=1
𝑖𝑖=1 (3.9)
em que µ𝑟 = 1
𝑁𝑝∑ ∑ 𝑥𝑖𝑗
𝑗𝑗=1
𝑖𝑖=1 , 𝑁𝑝 = 𝑖 ∗ 𝑗 (dimensão da secção) e 𝑥𝑖𝑗 o valor de cada píxel.
Pode então definir-se uma variável lógica, 𝑑𝑖𝑣𝑅𝑒𝑔, que representa a necessidade de decompor
cada região. A condição que retorna a validade da variável é representada pela equação 3.10 e o
valor 𝑒𝑥𝑝𝑆𝑡𝑑 é o que define o refinamento da segmentação da imagem.
{𝜎𝑟 ≤ 𝑒𝑥𝑝𝑆𝑡𝑑 , 𝑑𝑖𝑣𝑅𝑒𝑔 = 0𝜎𝑟 > 𝑒𝑥𝑝𝑆𝑡𝑑 , 𝑑𝑖𝑣𝑅𝑒𝑔 = 1
(3.10)
em que valor de 𝑒𝑥𝑝𝑆𝑡𝑑 foi variado entre 3, 5 e 7 para se conseguir construir três diferentes conjuntos
de dados de atributos das observações, dado que para cada valor diferente a considerar na condição
de segmentação, obtêm-se regiões diferentes com tempos computacionais associados (Figura 3-3).
Como esta segmentação teve em conta a homogeneidade de cor de cada região, é possível
representar cada região pela média de cor em que não se perderá informação relevante para a
classificação desejada. Este método é muito versátil dado que se conseguem obter diferentes
decomposições da mesma imagem, o que irá corresponder a diferentes valores de descritores a
considerar. É então possível fazer um estudo estatístico para definir o melhor parâmetro de 𝑒𝑥𝑝𝑆𝑡𝑑
que classifica novas imagens com boa precisão, tendo em conta o tempo de segmentação necessário.
Estes três diferentes vetores de atributos compõem diferentes dados para as mesmas observações
e foram designados de 𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 e 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7.
A obtenção dos tempos de processamento apresentados na Figura 3-3 tiveram em conta a
implementação do algoritmo de segmentação na versão de Matlab 2015a e o processamento num
computador as características apresentadas na Tabela 3-1.
Tabela 3-1: Especificações do computador utilizado neste estudo.
Sistema Operativo Windows 8.1, versão 64 bits
Processador Intel(R) Core(TM) i7-4710HQ CPU @ 2.50GHz
Memória Ram 8 GB
26
Figura 3-3: Segmentação da amostra com três diferentes critérios de homogeneidade das regiões e tempos associados a cada uma dessas decomposições.
3.3.2. Características da decomposição
Depois de concluída a segmentação das amostras, é possível saber a quantidade de regiões de
cada amostra, tal como as áreas associadas e o tempo de segmentação. Para definir qual a sensação
de cor que predomina, as quatro maiores áreas foram consideradas como as regiões predominantes
de cada amostra e as venadas presentes na superfície dos mármores são as regiões que apresentam
uma maior diferença na intensidade de cor quando comparadas com as regiões predominantes.
Com a transformação do espaço de cores RGB para HSV, é possível calcular média e desvios
padrões do brilho das cores (componente V) referentes à amostra global, regiões independentes e
área total das regiões predominantes. A condição (3.11) define-se a região 𝑟 é venada e define uma
variável lógica, 𝑟𝑒𝑔𝑉𝑒𝑛.
{|µV[região r] − µV[regiões predominantes]| ≤ σV[global] , regVen = 0
|µV[região r] − µV[regiões predominantes]| > σV[global] , regVen = 1 (3.11)
sendo µ𝑉 e 𝜎𝑉, a média e desvio padrão de V, respetivamente.
Consegue observar-se na Figura 3-4 a) que a condição 3.11 consegue definir as regiões que são
consideradas como venadas mas existe também a necessidade de saber se esses mesmos blocos
são venadas claras ou escuras. Como tal propõe-se neste trabalho uma nova condição que
caracteriza as venadas de acordo com a sua luminosidade. Da mesma forma que as venadas foram
determinadas anteriormente de acordo com (3.11), recorrendo à diferença absoluta das médias, para
diferenciar essas mesmas venadas é necessário considerar o sinal resultante dessa mesma
diferença:
expStd = 3Tempo = 14.80 s
expStd = 5Tempo = 4.10 s
expStd = 7Tempo = 2.09 s
27
{µV[região r] − µV[regiões predominantes] > σV[global] , escura
µV[região r] − µV[regiões predominantes] < −σV[global] , clara (3.12)
Assim todas as venadas anteriormente definidas terão uma nova variável associada, a
luminosidade. Uma vez que existem mármores de diversas cores, a análise referida é importante para
uma nova subclassificação que tem por base a cor das venadas, associadas à textura das mesmas.
Na Figura 3-4 b) pode observar-se uma representação de cores artificiais da distinção realizada para
as venadas.
Em suma, obtém-se informação pormenorizada de cada amostra tal como a quantidade de regiões
que a compõe, áreas associadas, quantidade de venadas claras e escuras, regiões predominantes e
tempo de segmentação para os três critérios de homogeneidade considerados.
a) b)
Figura 3-4: Apresentação das regiões predominantes e das venadas. a) Contorno verde corresponde às regiões predominantes e vermelho às venadas; b) Cores artificiais, verde corresponde às venadas
claras e vermelho às venadas escuras.
3.4. Definição dos atributos das observações
Dado que existe a necessidade de classificar novas amostras nas classes de cor e textura
previamente definidas, diferentes descritores serão especificados para cada classificador. A
dificuldade da escolha dos atributos a retirar é notória devido à quantidade de diferentes descritores
que existem para classificar imagens em conjuntos de cor e textura. Torna-se então necessário fazer
uma restrição dos atributos a considerar para não ter demasiados descritores que poderão piorar os
resultados o que também implica num processo de classificação menos demorado.
3.4.1. Atributos de cor considerados
Desta decomposição definiram-se as áreas predominantes que se caracterizam como sendo as
mais relevantes no que diz respeito à perceção da cor do mármore. Tal como os especialistas
classificam, a classe de cor da pedra é definida pelas cores predominantes, ou seja, as quatro maiores
regiões encontradas depois da segmentação. Considerou-se assim um grupo de descritores de cor
através de médias e desvios padrão no espaço de cores RGB e HSV:
28
µ𝑅𝐺𝐵 𝑝𝑟𝑒𝑑 =1
𝑅𝑝. ∑ µ𝑟[𝑅𝐺𝐵]
𝑅𝑝𝑟=1 (3.13)
𝜎𝑅𝐺𝐵 𝑝𝑟𝑒𝑑 =1
𝑅𝑝. ∑ 𝜎𝑟[𝑅𝐺𝐵]
𝑅𝑝𝑟=1 (3.14)
µ𝐻𝑆𝑉 𝑝𝑟𝑒𝑑 =1
𝑅𝑝. ∑ µ𝑟[𝐻𝑆𝑉]
𝑅𝑝𝑟=1 (3.15)
𝜎𝐻𝑆𝑉 𝑝𝑟𝑒𝑑 =1
𝑅𝑝. ∑ 𝜎𝑟[𝐻𝑆𝑉]
𝑅𝑝𝑟=1 (3.16)
sendo que 𝑅𝑝 é o número de regiões predominantes e cada um destes descritores contêm três
componentes distintas.
Para além da informação das áreas predominantes é necessário caracterizar a cor na imagem
global e procede-se de forma semelhante à exposta anteriormente em que se calcula a média e desvio
padrão para o espaço de cores RGB e HSV como descrito nas equações 3.1 e 3.2, respetivamente.
Assim já se tem a perceção de cor da imagem global e das áreas predominantes, constituindo um
total de 24 descritores.
Figura 3-5: Histograma dos tons de cinzentos da imagem global.
Em relação à sensação de brilho das cores que constituem a imagem, recorreu-se ao histograma
dos tons de cinzentos da imagem global, Figura 3-5. O valor de cinzentos com mais ocorrências de
pixéis na imagem representa um novo atributo.
Assim resulta um vetor com 25 descritores de cor a considerar, em que 13 desses descritores são
obtidos da imagem global e os restantes necessitam de ser calculados a partir da segmentação
QuadTree obtida.
Nú
mer
o d
e o
corr
ênci
as
Valores de tons de cinzentos
29
3.4.2. Atributos de textura considerados
A homogeneidade da imagem ou textura está diretamente relacionada com a quantidade de
regiões que o algoritmo de segmentação QuadTree decompõe (𝑁𝑟𝑒𝑔𝑖õ𝑒𝑠) uma vez que o critério de
divisão dessas mesmas regiões têm em conta um valor mínimo do desvio padrão da componente de
luminosidade de cores. Como a perceção de textura se relaciona com a variação de luminosidade,
utilizaram-se informações obtidas através da segmentação para calcular estes descritores.
Dado que a segmentação inicializa com uma divisão da imagem de entrada em quatro regiões
iguais (𝑓𝑖𝑟𝑠𝑡𝑆𝑒𝑔), um mármore é totalmente homogéneo se só for decomposto nessas mesmas
regiões. Quanto maior for a decomposição da amostra, menos homogéneo é o mármore:
𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑𝑒 = 1 −𝑚𝑖𝑛𝐴𝑟𝑒𝑎.(∑(𝑁𝑟𝑒𝑔𝑖õ𝑒𝑠)−𝑓𝑖𝑟𝑠𝑡𝑆𝑒𝑔)
Á𝑟𝑒𝑎 𝑡𝑜𝑡𝑎𝑙 𝑑𝑎 𝑖𝑚𝑎𝑔𝑒𝑚 (3.17)
sendo que 𝑚𝑖𝑛𝐴𝑟𝑒𝑎 é a condição de paragem do critério de segmentação, a área mínima por região
é definida como sendo igual a 4 pixéis. A área total da imagem é a quantidade de pixéis que cada
imagem contém, neste trabalho só se trataram de imagem quadradas com um total de 263680 pixéis.
O descritor denominado de homogeneidade assume valores entre 0 e 1, sendo que 0 corresponde a
um mármore nada homogéneo e 1 muito homogéneo.
Apesar deste descritor ser capaz de caracterizar qualquer mármore em termos de
homogeneidade, a perceção de textura de uma pedra natural tem em conta as grandes variações de
cor, definidas como venadas. Como tal surge a necessidade de quantificar o grau de percetibilidade
dessas mesmas venadas existentes na pedra, sendo elas claras ou escuras. Para todas as regiões
que foram consideradas venadas, calculou-se a média do brilho, gerando duas novas variáveis:
𝑣𝑎𝑟𝑉𝑐𝑙𝑎𝑟𝑜 e 𝑣𝑎𝑟𝑉𝑒𝑠𝑐𝑢𝑟𝑜, correspondentemente às venadas claras e escuras.
Como a quantidade de venadas claras e escuras não está diretamente correlacionada, o grau de
percetibilidade da cor das venadas, 𝑣𝑎𝑟𝑉𝑒𝑛𝑎𝑑𝑎𝑠, pode ser calculado da seguinte forma:
𝑣𝑎𝑟𝑉𝑒𝑛𝑎𝑑𝑎𝑠 = 𝑣𝑎𝑟𝑉𝑐𝑙𝑎𝑟𝑜.𝑝𝑉𝑒𝑛𝐶𝑙𝑎𝑟𝑜
𝑝𝑉𝑒𝑛+ 𝑣𝑎𝑟𝑉𝑒𝑠𝑐𝑢𝑟𝑜.
𝑝𝑉𝑒𝑛𝐸𝑠𝑐𝑢𝑟𝑜
𝑝𝑉𝑒𝑛 (3.18)
sendo que 𝑝𝑉𝑒𝑛 é a percentagem de todas as venadas, 𝑝𝑉𝑒𝑛𝐶𝑙𝑎𝑟𝑜 e 𝑝𝑉𝑒𝑛𝐸𝑠𝑐𝑢𝑟𝑜 a percentagem das
venadas claras e escuras, respetivamente. Define-se assim frações diferentes para as venadas
distintas.
Na secção 3.2.2 foram descritos diferentes descritores que podem ser calculados para a
caracterização de texturas através do GLMC. Como se recorre à segmentação QuadTree não se
verifica a necessidade de utilizar esses descritores, no entanto o descritor de entropia apresentado
na equação 3.8 foi calculado para a imagem global, fazendo parte do universo de descritores de
textura a considerar.
Em suma, o vetor de atributos referente à textura é composto por três descritores completamente
distintos, independentes e invariantes à escala e rotação da amostra, em que só um é calculado
diretamente da imagem global e os restantes dependem da segmentação QuadTree.
30
3.4.3. Normalização dos vetores de atributos
É necessário fazer uma normalização dos dados com o objetivo de evitar gamas de valores
diferentes. A normalização é realizada recorrendo ao método de normalização mínimo-máximo. Para
o total das 487 amostras disponíveis foi necessário verificar os valores máximos e mínimos de cada
atributo, representados por 𝑥𝑘𝑚𝑖𝑛 e 𝑥𝑘𝑚𝑎𝑥 , respetivamente. Para cada amostra 𝑛 e descritor 𝑘 o valor
normalizado, 𝑥𝑛,𝑘𝑛𝑜𝑟𝑚 , é obtido dos valores reais 𝑥𝑛,𝑘, através da seguinte equação:
𝑥𝑛,𝑘𝑛𝑜𝑟𝑚=
𝑥𝑛,𝑘−𝑥𝑘𝑚𝑖𝑛
𝑥𝑘𝑚𝑎𝑥−𝑥𝑘𝑚𝑖𝑛
(3.19)
Na Tabela 3-2 são apresentados todos os atributos considerados neste trabalho e os valores
máximos e mínimos para cada conjunto de descritores calculados das diferentes decomposições
consideradas.
Tabela 3-2: Descritores considerados neste trabalho e valores máximos e mínimos de todas as observações para cada critério de decomposição considerado na segmentação QuadTree.
Nº Designação do descritor
RawData3 RawData5 RawData7
Min Max Min Max Min Max
1 µR das áreas predominantes 123,02 206,91 106,51 205,93 121,64 206,59
2 µG das áreas predominantes 121,33 197,10 105,68 197,10 113,29 197,98
3 µB das áreas predominantes 94,96 177,64 90,41 177,60 85,19 178,27
4 σR das áreas predominantes 1,88 3,86 2,16 5,61 3,33 7,28
5 σG das áreas predominantes 1,90 3,16 2,44 5,28 3,22 7,35
6 σB das áreas predominantes 2,06 3,85 2,80 6,39 3,15 7,82
7 µH das áreas predominantes 0,08 0,14 0,08 0,15 0,07 0,14
8 µS das áreas predominantes 0,06 0,39 0,05 0,41 0,06 0,42
9 µV das áreas predominantes 0,48 0,81 0,42 0,81 0,48 0,81
10 σH das áreas predominantes 0,00 0,02 0,00 0,03 0,00 0,02
11 σS das áreas predominantes 0,01 0,03 0,01 0,03 0,01 0,04
12 σV das áreas predominantes 0,01 0,02 0,01 0,02 0,01 0,03
13 µR da imagem global 92,80 202,89 92,80 202,89 92,80 202,89
14 µG da imagem global 92,20 195,63 92,20 195,63 92,20 195,63
15 µB da imagem global 88,45 176,53 88,45 176,53 88,45 176,53
31
16 σR da imagem global 6,43 28,56 6,43 28,56 6,43 28,56
17 σG da imagem global 5,97 31,78 5,97 31,78 5,97 31,78
18 σB da imagem global 5,29 33,47 5,29 33,47 5,29 33,47
19 µH da imagem global 0,07 0,17 0,07 0,17 0,07 0,17
20 µS da imagem global 0,05 0,39 0,05 0,39 0,05 0,39
21 µV da imagem global 0,36 0,80 0,36 0,80 0,36 0,80
22 σH da imagem global 0,00 0,08 0,00 0,08 0,00 0,08
23 σS da imagem global 0,01 0,09 0,01 0,09 0,01 0,09
24 σV da imagem global 0,03 0,11 0,03 0,11 0,03 0,11
25 Valor de cinzentos com mais
ocorrências 90,00 198,00 90,00 198,00 90,00 198,00
26 Homogeneidade 0,77 0,98 0,80 1,00 0,83 1,00
27 Entropia 4,47 6,63 4,47 6,63 4,47 6,63
28 Percetibilidade das venadas 0,04 0,25 0,04 0,27 0,00 0,29
32
33
Modelos de Decisão
Uma vez obtidos os descritores das imagens digitais dos mármores, é necessário criar um sistema
automático que consiga classificar os diferentes tipos de mármore em termos de cor e textura. O
modelo de decisão baseado em regressão logística (RL) é muito utilizado para modelos de predição
binária e como tal foi considerado neste trabalho e é explicado neste capítulo. No entanto, também
se consideraram modelos fuzzy baseados em sistemas de inferência Takagi-Sugeno (TS). As duas
técnicas de clustering utilizadas para definir os antecedentes são baseadas no algoritmo Gustafson
Kessel (GF) e Fuzzy C-Means (FCM), são explicadas em detalhe. Por fim, a classificação de múltiplas
classes através de classificadores binários e os critérios de decisão para classificação final dos
mármores são explicados.
4.1. Regressão Logística
Os modelos de regressão constituem uma das ferramentas mais importante na análise estatística
de dados, sendo o seu principal objetivo explorar a relação entre uma ou mais variáveis explicativas
ou independentes, e uma variável resposta ou dependente [53]. RL é um caso particular das
regressões lineares onde a variável resposta apresenta apenas duas categorias, ou de alguma forma,
dividida em duas categorias assumindo valores 0 ou 1. Esta é uma técnica que tem como objetivo
modelar, a partir de um conjunto de observações, a relação dita logística entre a variável de resposta
binária e uma série de variáveis explicativas numéricas e/ou categóricas [53].
A essência do modelo RL assenta em modelar a probabilidade de que a resposta tome um destes
dois valores, em vez de prever os valores reais como os modelos de regressão linear. Em qualquer
regressão, a quantidade chave é o valor médio da variável de resposta dado o valor da variável
independente. Esta quantidade é denominada de valor médio condicional e é expressa como
𝐸[𝑌𝑛 | 𝑋𝑛], onde 𝑌𝑛 representa a variável de resposta para 𝑛 , observação a considerar 𝑛 = 1: 𝑁𝑎,
sendo 𝑁𝑎 o número de amostras, e 𝑋𝑛 a variável explicativa, vetor de atributos 𝑘-dimensional em que
𝑘 é o número de atributos [54]. A quantidade 𝐸[𝑌𝑛 | 𝑋𝑛 = 𝑥𝑘,𝑛] é lida como “valor esperado de 𝑌𝑛 dado
𝑋𝑛 = 𝑥𝑘,𝑛”. Admite-se que o valor médio condicional pode ser expresso como uma equação linear em
𝑥𝑛, em que 𝐸[𝑌𝑛 | 𝑋𝑛 = 𝑥𝑘,𝑛] pode assumir qualquer valor real e como tal se introduz 𝜋𝑛 como uma
variável simplificativa que representa a probabilidade de êxito para os valores do vetor de atributos,
𝑥𝑘,𝑛.
A relação entre 𝜋𝑛 e 𝑋𝑛 pode ser representada por uma função de resposta logística (logistic
response function) [54], apresentada na Figura 4-1, e pode ser obtida através da reprodução do
modelo de probabilidades através da equação 4.1, onde as probabilidades foram modeladas pela
função de distribuição (função de probabilidade cumulativa) da RL.
𝜋𝑛 = 𝐸[𝑌𝑛 = 1 | 𝑋𝑛 = 𝑥𝑘,𝑛] =𝑒𝛽0+𝛽1𝑥1,𝑛+𝛽2𝑥2,𝑛+⋯+𝛽𝑘𝑥𝑘,𝑛
1+𝑒𝛽0+𝛽1𝑥1,𝑛+𝛽2𝑥2,𝑛+⋯+𝛽𝑘𝑥𝑘,𝑛 (4.1)
34
onde 𝛽𝑘 são os parâmetros de cada atributo a descobrir da RL e e apresenta a base do logaritmo
natural.
Figura 4-1: Resposta da função da regressão logística [54].
Pode-se denominar a equação 4.1 de função de regressão logística (logistic regression function),
função não linear relativamente aos parâmetros 𝛽0, 𝛽1, 𝛽2, … 𝛽𝑘. No entanto, poderá ser linearizada
através da utilização da transformação logit [55] resultando de um valor transformado de 𝜋𝑛,
introduzindo 𝜋𝑛
1−𝜋𝑛 como a odds ratio de um evento (equação 4.3).
1 − 𝜋𝑛 = 𝐸[𝑌𝑛 = 0 | 𝑋𝑛 = 𝑥𝑘,𝑛] =1
1+𝑒𝛽0+𝛽1𝑥1,𝑛+𝛽2𝑥2,𝑛+⋯+𝛽𝑘𝑥𝑘,𝑛 (4.2)
𝜋𝑛
1−𝜋𝑛= 𝑒𝛽0+𝛽1𝑥1,𝑛+𝛽2𝑥2,𝑛+⋯+𝛽𝑘𝑥𝑘,𝑛 (4.3)
É possível, então, obter-se o logit através do logaritmo natural das odds ratio a ambos os lados da
equação 4.3, de acordo com a seguinte equação:
𝑓𝑛(𝑥1, … , 𝑥𝑘) = ln (𝜋𝑛
1−𝜋𝑛) = 𝛽0 + 𝛽1𝑥1,𝑛 + 𝛽2𝑥2,𝑛 + ⋯ + 𝛽𝑘𝑥𝑘,𝑛 (4.4)
Esta transformação já permite obter uma função linear dos parâmetros 𝛽0, 𝛽1, 𝛽2, … 𝛽𝑘, e assim é
possível criar um modelo que permita a predição de novas amostras.
4.2. Modelos Fuzzy
A maioria dos problemas da vida real não se podem resolver com a abordagem tradicional
desenvolvida pelo filósofo grego Aristóteles, onde o domínio é mapeado exclusivamente com
variáveis de dois estados, verdadeiro ou falso. É muitas vezes necessário introduzir um certo grau de
certeza à semelhança do raciocínio humano de senso comum. O significado da palavra de origem
inglesa “fuzzy” significa incerto, vago, impreciso, subjetivo ou difuso, e como tal, a lógica fuzzy vai
além do raciocínio booleano, baseando-se em aproximações de incertezas e suposições para tomar
decisões.
35
Esses algoritmos são amplamente utilizados atualmente em diversas áreas como: robótica,
automação de linhas de produção, simulações financeiras, previsão de readmissão de doentes ou até
mesmo classificação de objetos. Considerando os problemas reais nas indústrias, no comércio ou
mesmo no dia-a-dia das pessoas, fica claro a ausência de certezas absolutas quanto a algumas
decisões ou afirmações. Como tal a teoria fuzzy deve ser aplicada a estes tipo de problema e para
modelar um sistema fuzzy é necessário introduzir uma explicação teórica da criação dos mesmos. Na
Figura 4-1 apresenta-se um diagrama dos quatro passos essenciais para a sua modelação, interface
de “fuzzificação”, base de conhecimento, motor de inferência e interface de “desfuzzificação” [56].
Figura 4-2: Configuração do sistema fuzzy, adaptado de [56].
Interface de “fuzzificação”: primeiro é necessário determinar o grau de pertença dos
dados de entrada a cada conjunto fuzzy, através de funções de pertençam e de seguida
transformar valores de entrada crisp em graus de pertença, que são usados para associar
um grau a cada termo linguístico.
Base de conhecimento: contém as principais relações entre os dados de entrada e de
saída. O conhecimento é composto por uma base de dados onde são definidas as funções
de filiação para os termos linguísticos e a base das regras a considerar, geralmente
definidas por condições “se-então”.
Motor de inferência: calcula a saída do sistema fuzzy usando a informação contida na
base de regras e nos valores de entrada para produzir uma resposta.
Interface de “desfuzzificação”: responsável por fazer a ligação entre o sistema fuzzy e
a saída. Normalmente converte a saída fuzzy do motor de inferência para uma função
crisp, resultando numa saída binária.
Motor de Inferência
“Fuzzificação” “Desfuzzificação”
Base de Conhecimento
Dados Regras pré-estabelecidas
Se é e … é ,
então
Entradacrisp
Saídacrisp
36
4.2.1. Modelos Fuzzy Takagi-Sugeno
Modelos fuzzy Takagi-Sugeno (TS) consistem em regras fuzzy que traduzem a relação entre os
dados de entrada e saída usando uma lógica fuzzy [57]. Estas regras são tipicamente representadas
da seguinte forma:
𝑅𝑗: 𝑆𝑒 𝑥1 é 𝐴𝑗1 𝑒 … 𝑥𝑛 é 𝐴𝑗𝑛, 𝑒𝑛𝑡ã𝑜 𝑦𝑗 = 𝑓(𝑥1, … , 𝑥𝑘)
em que 𝐴𝑗1 e 𝐴𝑗𝑘 são conjuntos fuzzy no antecedente e 𝑦𝑗 = 𝑓(𝑥1, … , 𝑥𝑘) é uma função crisp
polinomial no consequente onde 𝑗 = 1, … , 𝐽 corresponde ao número da regra em que 𝐽 é o número
total de regras e 𝑥 = (𝑥1, … , 𝑥𝑘) é o vetor de entrada em que 𝑘 é o total de atributos.
Neste trabalho consideraram-se modelos fuzzy TS de primeira ordem [56] em que a função
polinomial no consequente toma a forma de 𝑦𝑗 = 𝑎𝑗𝑇𝑥 + 𝑏𝑗 em que 𝑎𝑗 é um vetor de parâmetros e 𝑏𝑗 é
um offset escalar da regra 𝑗. Assim o grau de ativação, 𝛽𝑗, para a regra 𝑗𝑡ℎ pode ser calculado pela
equação 4.5.
𝛽𝑗 = ∏ µ𝐴𝑗𝑘(𝑥),𝑘
𝑘=1 (4.5)
em que µ𝐴𝑗𝑘(𝑥) ∶ ℝ → [0,1].
A média ponderada das respostas individuais obtidas por cada regra resulta de uma resposta final
determinada pela equação 4.6.
𝑝 =∑ 𝛽𝑗(𝑎𝑗
𝑇𝑥+𝑏𝑗)𝐽𝑗=1
∑ 𝛽𝑗𝐽𝑗=1
(4.6)
Cada classificador terá de tomar valores binários, 𝑝′ 𝜖 {0,1}, em que 0 significa que a amostra de
mármore não pertence à classe, e 1 que pertence. No entanto, como 𝑝 𝜖 [0,1] é necessário
transformar este resultado linear num resultado booleano, aplicando um threshold 𝑡 para cada
classificador.
Na fase de treino dos modelos este threshold foi variado entre 0 e 1, tal que 𝑡 = 0,0.01, … ,1, e
foram obtidos índices de desempenho de TPR e SPC dos modelos. O valor de 𝑡 que atinge o mínimo
absoluto da diferença entre estes dois índices de desempenho, dado que representa o melhor
compromisso entre as taxas de TP e TN, é selecionado para cada classificador.
Assim é possível transformar o resultado linear de 𝑝 num resultado booleano 𝑝′ através da seguinte
comparação:
𝑝′ = {0 , 𝑝 < 𝑡 1 , 𝑝 ≥ 𝑡
(4.7)
4.3. Clustering
O objetivo final do clustering é dividir conjuntos de dados em clusters, ou grupos, distintos de modo
a que os tipos de dados que mais se assemelham fiquem no mesmo grupo [58]. As técnicas de
clustering são métodos de ML não supervisionado em que têm de fazer uma divisão dos dados em
37
diferentes grupos sem nenhuma informação à priori sobre a classe a que cada observação pertence.
Despendendo do tipo de dados utilizados e das características dessas observações, diferentes tipos
de medidas de semelhança podem ser utilizados, como por exemplo, intensidade, conetividade ou
distância.
Existem diversos algoritmos de clustering que podem ser distinguidos globalmente por hard e fuzzy
clustering [58]. No chamado “hard clustering” os dados são divididos pelos diferentes grupos e cada
observação só pode pertencer a apenas um dos grupos. Em “fuzzy clustering”, abordagem utilizada
neste trabalho, cada amostra pode pertencer a mais do que um grupo, sendo que para cada
observação é atribuído um grau de pertença a cada grupo.
Um dos algoritmos mais utilizados para reconhecimento de padrões, processamento de imagem,
data mining e modelação fuzzy são os algoritmos de “fuzzy clustering” [59]. Estes métodos dividem
os dados em conjuntos que se sobrepõem de forma a obter grupos, descrevendo as suas estruturas
subjacentes. Quando se está a lidar com problemas de clustering é necessário ter em conta diversos
parâmetros: o número de agrupamentos, a forma e volume dos mesmos, a inicialização do algoritmo
e a distribuição dos padrões de dados.
4.3.1. Fuzzy C-Means
O algoritmo FCM é o mais utilizado para problemas de fuzzy clustering que se baseia na
minimização de uma função objetivo 𝐽 dada pela equação 4.8 [60].
𝐽𝑚(𝑋, 𝑈, 𝑉) = ∑ ∑ 𝑈𝑔,𝑛𝑚 𝐷𝑔,𝑛(𝑥𝑛, 𝑣𝑔)𝑁𝑎
𝑛=1𝑁𝑔𝑔=1 (4.8)
onde 𝑔 representa o número de agrupamentos, 1 ≤ 𝑔 ≤ 𝑁𝑔 , 𝑁𝑔 é o total de agrupamentos
considerados, 𝑛 representa o número de observações, 1 ≤ 𝑛 ≤ 𝑁𝑎, em que 𝑁𝑎 é o total de amostras,
𝑈 é a matriz de partição fuzzy dada pela equação 4.9 composta por graus de pertença normalizados
𝜇𝑔,𝑛 (equação 4.10), V representa os centros de cada agrupamento 𝑣𝑔 dado a equação 4.13 e, por
fim, 𝐷𝑔,𝑛 é a medida de distância de cada amostra a cada 𝑣𝑔 (equação 4.14).
Para cada amostra 𝑥𝑛, é considerado um grau de pertença ,𝜇𝑔,𝑛 , para cada agrupamento 𝑔, e
assim constituem a matriz de partição 𝑈 [61]:
𝑈 = [
𝜇1,1 ⋯ 𝜇1,𝑁𝑎
⋮ ⋱ ⋮𝜇𝑁𝑔,1 ⋯ 𝜇𝑁𝑔,𝑁𝑎
] (4.9)
Os graus de pertença, 𝜇𝑔,𝑛, podem ser obtidos da seguinte forma:
𝜇𝑔,𝑛 =1
∑ (𝑑𝑛,𝑗
𝑑𝑞,𝑗)
2𝑚−1𝑁𝑔
𝑞=1
(4.10)
em que 𝑚 ∈ [0, ∞] é o peso do expoente que determina o grau de fuzziness dos agrupamentos.
Quanto maior o valor de 𝑚, maior é a sobreposição dos mesmos. Como já se fizeram muitos estudos
38
sobre este parâmetro, adotou-se fixar 𝑚 = 2 de acordo com [62], dado que é o parâmetro que em
geral melhor define as fronteiras dos agrupamentos.
Há que ter em consideração 𝜇𝑔,𝑛 ∈ [0,1], em que zero implica que a amostra 𝑛 não pertence ao
agrupamento 𝑔, e o oposto, um implica que a amostra 𝑛 pertence unicamente ao agrupamento 𝑔.
Pode-se concluir então que a soma de todos os graus de pertence de cada amostra tem de ser igual
a um [61], de acordo com:
∑ 𝜇𝑔,𝑛𝑁𝑔𝑔=1 = 1, ∀𝑔 (4.11)
E o total do grau de pertença de todas as amostras pertencentes a cada cluster tem de ser superior
a zero e menor que o total das amostras [61], dado por:
0 < ∑ 𝜇𝑔,𝑛𝑁𝑎𝑛=1 < 𝑁𝑎, ∀𝑖 (4.12)
Os centros de cada agrupamento são calculados através dos graus de pertença anteriormente
obtidos e são calculados por:
𝑣𝑔 =∑ 𝜇𝑔,𝑛
𝑚 𝑥𝑛𝑁𝑎𝑛=1
∑ 𝜇𝑔,𝑛𝑚𝑁𝑎
𝑛=1 (4.13)
Neste trabalho, para cada amostra é atribuído um grau de pertença a cada agrupamento, que é
proporcional à distância euclidiana entre a amostra e o centro do cluster, pode ser representada por:
𝐷𝑔,𝑛 = 𝑑𝑔,𝑛2 (𝑥𝑛 , 𝑣𝑔) = ‖𝑥𝑛 − 𝑣𝑔‖
2= (𝑥𝑛 − 𝑣𝑔)
𝑇𝐴𝑔(𝑥𝑛 − 𝑣𝑔) (4.14)
em que 𝐴𝑔 é uma matriz simétrica positiva, sendo habitualmente a matriz identidade no algoritmo
FCM [61]. Esta medida de distância euclidiana é adequada para agrupamentos de dados de forma
esférica [63].
4.3.2. Gustafson-Kessel
No caso de os dados constituírem agrupamentos de diferentes formas e orientações, o algoritmo
GK [64] pode ser uma boa alternativa, dado que calcula a distância Mahalanobis [59, 65]. A grande
diferença destes métodos de calcular a distância é a definição da forma dos agrupamentos, tal como
apresentado na Figura 4-3.
Figura 4-3: Diferenças entre distância Euclidiana (rosa) e Mahalanobis (azul), citado de [56].
39
Na equação 4.14, a matriz 𝐴𝑔 passa a ser calculada pela matriz de covariância do agrupamento
𝑃𝑔, através da seguinte equação:
𝐴𝑔 = 𝑃𝑔−1 (4.15)
No cálculo da distância (equação 4.14) é também necessário adicionar uma constante de volume,
|𝐴𝑔| = 𝜌𝑔. No entanto, toda a metodologia do algoritmo GK é idêntica à utilizada no algoritmo FCM
em que a função objetivo é dada pela equação 4.8, os centros dos agrupamentos são novamente
calculados pela equação 4.13 e os graus de pertença pela equação 4.10. Assim, com a alteração do
cálculo da medida da distância de cada amostra aos centros dos agrupamentos melhora no que diz
respeito aos modelos se adaptarem à possível dispersão dos dados.
4.4. Múltiplos Classificadores
Este trabalho propõe uma solução para a resolução de um problema industrial e verificou-se que
a classificação de pedras de mármore é diferente nas diversas geografias. Uma determinada pedreira
pode extrair pedras de diversas famílias de cor e textura, e, por vezes, pode ser encontrada uma
pedra que não se enquadre em qualquer outra família existente. Torna-se necessário então criar
múltiplos classificadores binários para cada família que se pretende classificar através de graus de
semelhança de cor das novas amostras.
Foram criados seis classificadores para as diferentes famílias de cor e três classificadores para
das diferentes famílias de textura através dos dados considerados com mais amostras
disponibilizadas. No processo de treino dos modelos as diferentes classes de classificação foram
avaliadas independentemente e adotando uma estratégia de OvA de classificação [66],os dados de
entrada nos modelos são compostos por todas as observações em que o vetor de predição, 𝑉𝑝𝐶 (𝑛),
toma valores booleanos verdadeiros para as observações, 𝑛, que foram pré classificadas como
pertencentes dessa mesma classe, 𝐶, e as restantes observações como falsas.
No caso de classificação de cor, cada classificador terá associado um valor diferente de threshold
calculado na fase de treino dos modelos, 𝑡𝐶, em que 𝐶 = [1: 𝑛_𝑐𝑙𝑎𝑠𝑠𝑒𝑠]. Assim, uma nova amostra 𝑛
ao ser processada por um classificador 𝐶, se 𝑝𝐶(𝑛) < 𝑡𝐶 é considerado como não pertencente a essa
classe, 𝑝′𝑐(𝑛) = 0, caso contrario 𝑝′
𝑐(𝑛) = 1. No entanto, uma determinada amostra 𝑛 poderá ser
classificada como pertencente a mais do que uma classe, nesse caso é necessário tomar uma decisão
em qual classe é que essa mesma amostra melhor se enquadra de acordo com 4.16.
𝑆𝑒 ∑ 𝑝′𝑐(𝑛)
𝑛_𝑐𝑙𝑎𝑠𝑠𝑒𝑠
𝐶=1
> 1, 𝑖𝑑(𝑛) = arg𝐶 (𝑝′𝑐(𝑛) = 1)
𝑒𝑛𝑡ã𝑜 𝑃𝑐𝑜𝑟(𝑛) = arg 𝑚𝑎𝑥𝑖𝑑(𝑛)(𝑝𝑖𝑑(𝑛)(𝑛)) (4.16)
em que 𝑃𝑐𝑜𝑟(𝑛) se refere à classe a que a amostra 𝑛 melhor se assemelha e 𝑖𝑑(𝑛) as classes que
inicialmente a amostra foi considerada semelhante. Todavia, existe a possibilidade de
∑ 𝑝′𝑐(𝑛)𝑛_𝑐𝑙𝑎𝑠𝑠𝑒𝑠
𝐶=1 = 0, o que significa que a amostra 𝑛 não se assemelha a nenhuma das classes e
assim será considerada como cor indiferenciada.
40
No caso de classificação de novas amostras em termos de textura, o problema é mais simples
dado que existe a obrigatoriedade de estas serem classificadas nas diferentes texturas, ou
homogeneidades de cor, consideras. Desta forma não é necessário transformar o valor linear 𝑝𝐶(𝑛)
para booleano porque ao verificar o maior valor de 𝑝𝐶(𝑛) para todas as classes 𝐶 consideradas,
resulta de uma valor de 𝑃𝑡𝑒𝑥𝑡(𝑛) que pode ser descrito pela seguinte equação:
𝑃𝑡𝑒𝑥𝑡(𝑛) = arg 𝑚𝑎𝑥𝑐( 𝑝𝐶(𝑛)) (4.17)
Desta forma é possível criar um sistema automático de classificação de 𝐶 classes de cor e textura
para pedras de mármore polidas. Neste trabalho foram modelados diferentes classificadores para as
6 classes de cor e 3 de textura definidas pelos dados disponibilizados, e como tal, na Figura 4-4
apresenta-se um diagrama de classificação para essas mesmas classes com um mármore exemplo
classificado.
Figura 4-4: Diagrama do sistema de classificação de cor e textura.
Dado que este trabalho se foca no estudo estatístico de classificação de múltiplas classes com
diferentes métodos de modelação, com este sistema de classificação torna-se possível avaliar as
classificações de amostras que os modelos nunca tiveram conhecimento, dados de verificação, e
calcular percentagens de erro de classificação ao comparar com a pré classificação efetuada pelos
peritos.
Novas amostras
ED_Art_Deco
ED_Rosa
ED_Trovoada
ED_Pastel
FM_Art_Deco
FM_Sunset
Muito Homogéneo
Pouco Homogéneo
Nada Homogéneo
Classificação Cor
Classificação Textura
Nenhuma
Exemplo de classificação:ED_Art_Deco, Pouco Homogéneo
41
Resultados
De todos mármores digitalizados (545 amostras) foram escolhidas as 6 classes de cor com maior
número de amostras, o que resultou no total de 487 amostras com uma pré classificação realizada
pelos peritos em termos de cor e textura. Foram considerados 25 atributos/descritores das amostras
que caracterizam a cor e 3 atributos/descritores para a textura ou homogeneidade. É assim possível
criar modelos de decisão baseados em ML supervisionado o que permite avaliar a qualidade do treino
dos modelos e as suas classificações para novas amostras. Foram criados três diferentes conjuntos
de descritores (𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 e 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7) dos mármores dado que se consideraram
diferentes critérios de decomposição para o algoritmo QuadTree, o que resultou em diferentes
refinamentos das amostras e diferentes tempos computacionais. Pretende-se posteriormente concluir
qual o melhor parâmetro de segmentação a considerar.
Podem avaliar-se os modelos de decisão através dos seus desempenhos com diferentes dados
de treino e teste pelo melhor resultado do critério de desempenho. Para os diferentes conjuntos de
modelação e verificação dos dados globais com todas as percentagens de treino consideradas, como
apresentado na secção 2.2.4. Uma vez que se trata de um problema de múltiplas classes binárias,
terá de se considerar todas as classes independentemente e definir os melhores parâmetros de
modelação gerais para que estes resultados possam ser reproduzidos com outras amostras.
Com as considerações referidas é possível realizar um estudo estatístico que conclua qual o
melhor modelo a considerar para classificar com precisão os mármores em termos de cor e textura,
recorrendo ao menor número de amostras necessárias para treino. Foram testados três modelos de
decisão:
Regressão Logística;
Modelo Fuzzy com Gustafson Kessel (GK) clustering;
Modelo Fuzzy com Fuzzy C-Means (FCM) clustering.
Neste capítulo são apresentados os resultados obtidos dos múltiplos classificadores de cor e
textura e como se considera um número elevado de variáveis é necessário fazer uma análise faseada
para cada variável de forma a ir fixando parâmetros até encontrar o método de decisão que melhor
classifica os mármores. Serão apresentados os seguintes passos pelos quais se processa esta
análise:
1. Verificação do número de clusters que os modelos fuzzy propostos necessitam para
agrupar as amostras semelhantes em cada classificador;
2. Escolha da menor percentagem de dados de treino para que todos os modelos de decisão
considerados tenham um bom desempenho;
3. Escolha do critério de segmentação QuadTree;
4. Conclusão dos melhores modelos através do critério de desempenho;
5. Verificação de erros de classificação para os melhores classificadores de diferentes
percentagens de treino.
42
5.1. Segmentação QuadTree das amostras digitalizadas
A segmentação das imagens digitais dos mármores é um ponto relevante neste estudo dado que
o conjunto de descritores calculados das amostras depende da qualidade deste método para a
identificação das regiões homogéneas. O algoritmo QuadTree decompõe as imagens em diferentes
regiões através do desvio padrão de luminosidade. Como se consideraram três diferentes valores
para o desvio padrão, 𝑒𝑥𝑝𝑆𝑡𝑑 = [3,5,7], consegue-se obter diferentes famílias de descritores
(𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 e 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7). A textura de cada amostra está diretamente relacionada com a
quantidade de regiões que se consegue definir através desta segmentação. Na Tabela 5-1 observam-
se as diferentes segmentações efetuadas para amostras como exemplo de cada classe de textura e
identificação de venadas (traçado vermelho), as maiores regiões consideradas como predominantes
(traçado verde) e as restantes regiões (traçado azul) dos mármores.
Tabela 5-1: Resultado da segmentação QuadTree das diferentes classes de textura para os diferentes critérios de homogeneidade.
Original 𝑒𝑥𝑝𝑆𝑡𝑑 = 3 𝑒𝑥𝑝𝑆𝑡𝑑 = 5 𝑒𝑥𝑝𝑆𝑡𝑑 = 7
Muito Homogéneo (MH)
(ex: ED_Trovoada_002)
Pouco Homogéneo (PH)
(ex: ED_Art_Deco_003)
Nada Homogéneo (NH)
(ex: FM_Art_Deco_004)
Observam-se diferentes densidades de regiões para cada classe de textura e quanto maior o valor
considerado de 𝑒𝑥𝑝𝑆𝑡𝑑, menor é a decomposição das amostras. Como a técnica de segmentação
QuadTree avalia a homogeneidade particular de cada região, o tempo computacional é maior quanto
menor for 𝑒𝑥𝑝𝑆𝑡𝑑. Para cada classe de textura apresentam-se os tempos médios, máximos e mínimos
de segmentação referentes a cada critério de decomposição (Tabela 5-2)
Para se obter uma classificação de mármores precisa é necessário extrair bons descritores das
amostras de treino para criar modelos de decisão eficientes, no entanto deve ter-se em conta o tempo
total de classificação de cada amostra. O intervalo de tempo despendido na classificação é bastante
inferior ao de segmentação, o que torna irrelevante considerar o tempo de classificação neste estudo.
43
Assim, é necessário escolher o melhor parâmetro de decomposição de imagem, tendo em conta o
seu intervalo de tempo de segmentação.
Tabela 5-2: Tempos de processamento da segmentação QuadTree.
𝑅𝑎𝑤𝐷𝑎𝑡𝑎3 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7
Tempo [s] Média Max Min Média Max Min Média Max Min
MH 5,45 17,83 2,34 1,92 4,70 0,67 0,62 1,93 0,19
PH 9,66 22,39 3,75 3,74 9,37 1,33 1,73 7,58 0,20
NH 14,37 20,30 7,83 9,37 20,08 5,15 5,62 15,02 1,84
5.2. Procedimento para o cálculo dos índices de desempenho
Para cada família de descritores consideram-se os 5 diferentes conjuntos de modelação e, para
cada um destes conjuntos foram criados dois subconjuntos, treino e teste, tal como apresentado na
secção 2.2.4. Uma vez que neste trabalho se pretende fazer um estudo da quantidade mínima de
dados de treino, foram considerados 20%, 40%, 60% e 80% dos dados de modelação para treino. Os
dados constituintes de cada subconjunto de treino foram selecionados pelo método 10x 5-fold para
posteriormente se recorrer à técnica de validação cruzada para que os resultados obtidos de CDP
(apresentado na secção 2.2.5) dos modelos sejam generalizados.
Tendo uma abordagem de classificação de múltiplas classes, para cada classe e cada método de
modelação obtém-se valores do critério de desempenho CDP, considerando as percentagens de
treino e cada conjunto de descritores, dado que são estes os parâmetros a fixar para definir os
melhores classificadores de cor e textura. Na Figura 5-1 apresenta-se um esquema que ajudará na
perceção de todas as variáveis.
Figura 5-1: Estrutura da metodologia para obter resultados de CDP.
Descritores
2
2
44
Lista de variáveis:
𝑛_𝑐𝑙𝑎𝑠𝑠𝑒𝑠 : número de classificadores, no caso de cor são 6 e no caso de textura são 3;
𝐾𝑐𝑜𝑛𝑗 : número de conjuntos de modelação;
𝑛_𝑝𝑒𝑟𝑐 : número de diferentes percentagens consideradas, 4.
Para cada percentagem de treino obtém-se pela técnica de validação cruzada valores médios e
desvios padrão dos resultados CDP de todas combinações de seleção de dados para cada conjunto
de modelação (Tabela 5-3). Adotando uma abordagem conservadora, com a finalidade de que os
resultados de CDP possam ser generalizados para qualquer conjunto de dados escolheram-se os
valores mínimo das médias e máximo dos desvios padrão dos cinco conjuntos de modelação. Assim
para cada percentagem de dados de treino, resulta somente um resultado de CDP.
Tabela 5-3: Resultados de CDP do modelo fuzzy GK clustering para o classificador de ED_Trovoada
com a família de descritores 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑
Conjuntos de Modelação (𝐾𝑐𝑜𝑛𝑗)
𝑓 = 1 𝑓 = 2 𝑓 = 3 𝑓 = 4 𝑓 = 5
20% 0,86 ± 0,07 0,83 ± 0,08 0,86 ± 0,06 0,86 ± 0,08 0,84 ± 0,07
40% 0,94 ± 0,03 0,95 ± 0,03 0,95 ± 0,02 0,95 ± 0,03 0,96 ± 0,03
60% 0,96 ± 0,02 0,97 ± 0,02 0,96 ± 0,02 0,96 ± 0,02 0,97 ± 0,02
80% 0,97 ± 0,02 0,97 ± 0,02 0,97 ± 0,03 0,97 ± 0,02 0,98 ± 0,03
5.3. Parametrização dos modelos fuzzy
Na modelação dos modelos fuzzy existem diversos parâmetros que requerem especificação no
motor de inferência e, como apresentado nas secções 4.2 e 4.3, o único parâmetro que não se
considerou fixo é o número de clusters dos modelos. Para avaliar os modelos criados considerou-se
um critério de desempenho CDP (equação 2.5). A seleção do melhor número de clusters teve em
conta a tendência deste critério para as diferentes conjugações de dados de modelação e
percentagens de treino.
Para esta análise considerou-se a família de descritores 𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, dado que a tendência dos
resultados é idêntica para as outras famílias de descritores. Foram estudados dois métodos de
clustering, GK e FCM, e serão apresentados todos os resultados obtidos para as combinações de
𝑛_𝑐𝑙𝑢𝑠𝑡𝑒𝑟𝑠 (2, 3, 4 e 5) e 𝑛_𝑝𝑒𝑟𝑐 (20%, 40%, 60% e 80% de dados de treino).
5.3.1. Gustafson Kessel Clustering
Nesta secção são apresentados e analisados os resultados obtidos para os modelos fuzzy com
diferentes números de clusters definidos pelo método de GK clustering. Na Figura 5-2 e na Figura 5-3
são representados gráficos dos valores mínimos das médias do critério de desempenho de avaliação
de modelos dos cinco diferentes conjuntos de modelação para todos os classificadores de cor e
45
textura, respetivamente. Assim, e embora de uma forma qualitativa, torna-se possível interpretar os
resultados obtidos, no entanto os valores quantitativos encontram-se no anexoA.1.
a)
b)
c)
d)
e)
f)
Figura 5-2: Resultados de CDP dos classificadores de Cor pelo método GK clustering com diferentes clusters e percentagens de treino. a) ED_Art_Deco; b) ED_Rosa; c) ED_Trovoada; d)
ED_Pastel; e) FM_Art_Deco; f) FM_Sunset.
Com estes resultados observa-se que para 2, 3 e 4 clusters, o valor do desempenho toma valores
superiores quando se aumenta a percentagem de treino, no entanto para 5 clusters pode observar-
se, na maioria das classes, uma descida do desempenho com o aumento da percentagem de treino
dos 20% para 40%. Assim é possível concluir que a escolha de 5 clusters não representa uma boa
divisão de dados nos seus diferentes clusters.
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
46
A curva que obtém melhores resultados para a maioria das classes de cor é a que representa o
modelo que considera 2 clusters, apresentando um grande aumento de desempenho nos 40% de
dados de treino.
a)
b)
c)
Figura 5-3: Resultados de CDP dos classificadores de Textura pelo método GK clustering com diferentes clusters e percentagens de treino. a) Muito Homogéneo; b) Pouco Homogéneo; c) Nada
Homogéneo.
No caso dos classificadores de textura, os resultados para os diferentes números de clusters são
muito idênticos e tomam valores de desempenho inferiores aos observados nas classes de cor. Isto
ocorre porque a pré classificação dos mármores muito homogéneos e pouco homogéneos, é bastante
complicada. Pode então afirmar-se que estes resultados são muito dependentes da subjetividade da
pré classificação.
Quanto mais clusters considerados, mais regras de inferência se precisam correlacionar e avaliar
através da distância de cada amostra aos centros dos clusters, o que implica um modelo mais
complexo e por consequência mais demorado. Como tal, foi considerado o menor número de clusters
possível, apesar de para a classe Muito Homogénea não ser o melhor parâmetro, que tomam valores
de CDP próximos de 0,75.
Através do modelo fuzzy TS baseado em GK clustering conclui-se que para as classificadores de
cor e textura necessita-se dois clusters.
0,70
0,75
0,80
0,85
0,90
0,95
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,70
0,75
0,80
0,85
0,90
0,95
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,70
0,75
0,80
0,85
0,90
0,95
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
47
5.3.2. Fuzzy C-Means Clustering
Admitindo o método de apresentação de resultados anteriormente utilizado, nesta secção
apresentam-se os resultados correspondentes aos modelos fuzzy com diferentes números de clusters
definidos pelo método FCM clustering. Na Figura 5-4 e Figura 5-5 são apresentados os resultados
obtidos de CDP para os modelos de classificação de cor e textura, respetivamente. O método de
obtenção dos resultados é desenvolvido através dos mesmos procedimentos e os valores
quantitativos são apresentados no anexoA.2.
a)
b)
c)
d)
e)
f)
Figura 5-4: Resultados de CDP dos classificadores de Cor pelo método FCM clustering com diferentes clusters e percentagens de treino. a) ED_Art_Deco; b) ED_Rosa; c) ED_Trovoada; d)
ED_Pastel; e) FM_Art_Deco; f) FM_Sunset.
0,4
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,4
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%0
,6(T
PR
)+0
,4(S
PC
)Percentagem de Treino
0,4
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,4
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,4
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,4
0,5
0,6
0,7
0,8
0,9
1,0
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
48
a)
b)
c)
Figura 5-5: Resultados de CDP dos classificadores de Textura pelo método FCM clustering com diferentes clusters e percentagens de treino. a) Muito Homogéneo; b) Pouco Homogéneo; c) Nada
Homogéneo.
Para os modelos baseados no método de FCM clustering, o desempenho para 2 clusters
apresenta valores superiores a 0,9 para todas as classes de cor a partir dos 40% de dados de treino.
Os resultados para os modelos de textura apresentam valores muito idênticos aos anteriores, o que
se pode concluir que se deve considerar o menor número de clusters.
Através desta análise conclui-se que para os modelos fuzzy TS baseados em FCM clustering, os
melhores valores de desempenho para os modelos de cor e textura devem definir-se dois clusters
no espaço de dados de treino.
5.4. Model Assessment
Nesta secção são apresentados todos os resultados obtidos para os modelos de decisão fuzzy
baseados nos métodos GK e FCM clustering com 2 clusters e Regressão Logística (RL). O objetivo
deste estudo é definir uma percentagem mínima de dados necessários para treinar os modelos que
permite a obtenção de bons desempenhos na modelação com a finalidade de concluir qual a família
de descritores que melhores resultados obtém, considerando o intervalo de tempo despendido na
segmentação QuadTree dos mesmos apresentados na secção 5.1.
0,70
0,75
0,80
0,85
0,90
0,95
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,70
0,75
0,80
0,85
0,90
0,95
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
0,70
0,75
0,80
0,85
0,90
0,95
20% 40% 60% 80%
0,6
(TP
R)+
0,4
(SP
C)
Percentagem de Treino
49
5.4.1. Avaliação da melhor percentagem de treino
Para os diferentes conjuntos de descritores (𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 e 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7) os desempenhos
dos modelos testados para as diferentes percentagens de treino apresentam a mesma tendência de
resultados e, como tal, é possível considerar a melhor percentagem de treino através da avaliação do
desempenho para 𝑅𝑎𝑤𝐷𝑎𝑡𝑎3.
Na Figura 5-6 e na Figura 5-7 são representados histogramas dos valores das médias e dos
desvios padrão, através de barras de erro, do critério de desempenho CDP dos modelos para todas
as percentagens de treino e todos os classificadores de cor e textura, respetivamente. As barras de
erro representadas podem tomar valores superiores a 1 dado que representam os valores do desvio
padrão máximo dos conjuntos de dados de modelação, tal como explicado na secção 5.2. Com esta
representação é possível fazer uma avaliação dos resultados obtidos de todas as combinações de
dados para cada percentagem de treino. No anexoB.1 apresentam-se todos os resultados
quantitativos.
a)
b)
0,55
0,6
0,65
0,70,75
0,8
0,85
0,9
0,951
1,05
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
0,6
(TP
R)+
0,4
(SP
C)
20% Treino 40% Treino 60% Treino 80% Treino
0,55
0,6
0,650,7
0,75
0,80,85
0,9
0,95
1
1,05
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
0,6
(TP
R)+
0,4
(SP
C)
20% Treino 40% Treino 60% Treino 80% Treino
50
c)
Figura 5-6: Resultados de CDP dos classificadores de Cor para as diferentes percentagens de dados de treino consideradas e diferentes modelos de classificação: a) Modelo fuzzy com GK clustering; b)
Modelo fuzzy com FCM clustering; c) Regressão Logística.
Em todos os modelos de decisão e para todas as classes de cor observa-se uma evolução positiva
do desempenho à medida que a percentagem de treino aumenta. No entanto é possível concluir que
para o modelo fuzzy com GK clustering tem-se um aumento do desempenho quando se passa dos
20% para os 40% de dados de treino, tomando valores perto de 0,9. para a maior parte das classes
de cor.
Para o modelo fuzzy com FCM clustering também se verifica um aumento considerável quando
passa de 20% para 40% de dados de treino, não havendo grandes diferenças para as percentagens
seguintes.
A regressão logística apresenta resultados muito idênticos para todas as percentagens, o que leva
a concluir que só necessita de 20% de dados para treino para reproduzir bons resultados. No entanto,
para os outros modelos observa-se que a melhor percentagem de treino para classificar os mármores
nas diferentes famílias de cor é de 40%.
a)
0,55
0,6
0,650,7
0,75
0,8
0,85
0,9
0,951
1,05
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
0,6
(TP
R)+
0,4
(SP
C)
20% Treino 40% Treino 60% Treino 80% Treino
0,55
0,6
0,65
0,7
0,75
0,8
0,85
0,9
0,95
1
MH PH NH
0,6
(TP
R)+
0,4
(SP
C)
20% Treino 40% Treino 60% Treino 80% Treino
51
b)
c)
Figura 5-7: Resultados de CDP dos classificadores de Textura para as diferentes percentagens de dados de treino consideradas e diferentes modelos de classificação: a) Modelo fuzzy com GK
clustering; b) Modelo fuzzy com FCM clustering; c) Regressão Logística.
Para a classe NH (“nada homogénea”) todos os métodos de classificação apresentam resultados
de CDP próximos de 0,9. No entanto, para as outras classes de textura, o método que apresenta uma
melhor classificação é o modelo fuzzy baseado em GK clustering.
A percentagem de treino não é relevante para os modelos de decisão considerados na
identificação das famílias de textura existentes na galeria de mármores considerada neste trabalho.
Assim conclui-se que a melhor percentagem de dados de treino é de 20% dos dados de modelação,
o que demonstra ser um ótimo resultado para o problema inicial de pré-classificação das amostras.
Conclui-se assim que é necessário 40% dos dados de modelação para criar modelos com bons
índices de desempenho para as diferentes classes de cor, o que equivale a aproximadamente 26
amostras de cada família de cor, e 20% de dados para treinar os classificadores de texturas, o que
equivale a aproximadamente a 35 amostras de cada família de textura.
0,55
0,6
0,65
0,7
0,75
0,8
0,85
0,9
0,95
1
MH PH NH
0,6
(TP
R)+
0,4
(SP
C)
20% Treino 40% Treino 60% Treino 80% Treino
0,55
0,6
0,65
0,7
0,75
0,8
0,85
0,9
0,95
1
MH PH NH
0,6
(TP
R)+
0,4
(SP
C)
20% Treino 40% Treino 60% Treino 80% Treino
52
5.4.2. Avaliação do melhor conjunto de descritores
Com as percentagens de dados para treino fixadas em 40% para os classificadores de cor e 20%
para textura, é necessário concluir qual o melhor conjunto de descritores (𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 e
𝑅𝑎𝑤𝐷𝑎𝑡𝑎7). Uma vez que neste trabalho se apresenta um problema de múltiplas classes de cor e
textura verificou-se a necessidade de adotar uma abordagem conservadora e escolher as classes de
cor e textura que obtiveram piores resultados de desempenho. Assim a escolha do conjunto terá
sempre em conta a classe mais complexa a nível de modelação do sistema de decisão, o que resulta
de bons desempenhos para as restantes.
Na Figura 5-8 são apresentados dois histogramas que identificam os piores desempenhos das
classes de cor e textura dos diferentes modelos de decisão considerados para 𝑅𝑎𝑤𝐷𝑎𝑡𝑎3, 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5
e 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7. Apresentam-se no anexo B.2 os resultados quantitativos.
a)
b)
Figura 5-8: Resultados das classes com piores valores de CDP dos métodos de classificação para os três conjuntos de descritores. a) Cor; b) Textura.
Os resultados obtidos para os diferentes classificadores de cor, não apresentam grandes
diferenças significativas para os diferentes conjuntos de descritores, dado que a maior parte dos
0,5
0,55
0,6
0,65
0,7
0,75
0,8
0,85
0,9
0,95
1
RawData3 RawData5 RawData7
0,6
(TP
R)+
0,4
(SP
C)
GK FCM RL
0,5
0,55
0,6
0,65
0,7
0,75
0,8
0,85
0,9
0,95
1
RawData3 RawData5 RawData7
0,6
(TP
R)+
0,4
(SP
C)
GK FCM RL
53
descritores de cor são extraídos da imagem global. Apesar de se considerarem as quarto maiores
regiões obtidas da segmentação QuadTree como regiões predominantes de cor, para os diferentes
critérios de decomposição de imagem, a informação de cor das regiões predominantes mantêm-se.
Posto isto, a escolha do melhor conjunto de descritores a considerar terá de ter em conta somente os
resultados obtidos dos classificadores de textura.
Como a textura de um mármore está diretamente relacionada com a homogeneidade de cor da
mesma, através do descritor de homogeneidade, equação 3.17, é possível concluir que o resultado
da segmentação é um fator de enorme relevância para a classificação de texturas. Os mármores são
considerados mais homogéneos quanto menor for a decomposição das imagens.
Através da análise da Figura 5-8 b) é possível concluir que o melhor critério de segmentação
QuadTree é decompor cada região que contenha o desvio padrão dos valores de luminosidade
superior a 5.
Concluindo, o conjunto de descritores que prevê uma melhor classificação dos mármores é
𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓. Para a galeria de mármores disponibilizada para este estudo, dependendo da
homogeneidade de cada amostra, o computar utilizado neste estudo (Tabela 3-1) consegue classificar
cada amostra entre os intervalos de tempo apresentados na Tabela 5-4.
Tabela 5-4: Intervalos de tempo computacional de segmentação para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓.
Média Máximo Mínimo
Intervalo de Tempo [s] [1,92; 9,37] [4,70; 20,08] [0,67; 5,15]
5.5. Índices de performance dos modelos
Nesta fase de modelação, foram calculados diversos índices de desempenho para cada modelo
treinado. Como se considerou somente o índice CDP para avaliar os modelos e assim definir os
melhores parâmetros de modelação, verifica-se a necessidade de apresentar os resultados de todos
os índices de desempenho para os parâmetros definidos de modelação para os múltiplos
classificadores de cor e textura.
Apresentam-se então os resultados de AUC (area under the ROC curve), ACC (accuracy), SPC
(specitivity), TPR (sensitivity) e CDP (critério de desempenho ponderado), para os métodos de
decisão inteligente considerados:
Modelo fuzzy com sistema de inferência TS baseado no GK clustering;
Modelo fuzzy com sistema de inferência TS baseado no FCM clustering;
Regressão Logística.
Com o estudo previamente efetuado definiu-se que os modelos que melhor classificavam as
diferentes cores necessitam de 40% dos dados de treino para modelação com os resultados de
54
descritores do conjunto 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5. Na Tabela 5-5, Tabela 5-6 e Tabela 5-7 apresentam-se todos os
valores dos índices de desempenho para as diferentes técnicas de modelação.
Tabela 5-5: Índices de desempenho de GK para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 40% de treino para as diferentes classes de cor.
40% Treino ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
AUC 0,93±0,07 0,95±0,11 0,92±0,07 0,91±0,07 0,84±0,21 0,92±0,07
ACC 0,91±0,04 0,97±0,03 0,93±0,03 0,88±0,04 0,94±0,03 0,9±0,03
SPC 0,91±0,05 0,97±0,03 0,92±0,04 0,88±0,05 0,98±0,03 0,91±0,04
TPR 0,92±0,07 0,94±0,13 0,94±0,05 0,88±0,09 0,64±0,22 0,86±0,13
CDP 0,92±0,06 0,95±0,09 0,93±0,04 0,88±0,08 0,77±0,14 0,88±0,09
Tabela 5-6: Índices de desempenho de FCM para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 40% de treino para as diferentes classes de cor.
40% Treino ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
AUC 0,99±0,01 0,96±0,04 0,98±0,02 0,95±0,02 0,96±0,03 0,97±0,01
ACC 0,95±0,02 0,96±0,02 0,95±0,02 0,90±0,04 0,90±0,05 0,93±0,02
SPC 0,96±0,03 0,97±0,02 0,95±0,03 0,90±0,05 0,90±0,06 0,94±0,03
TPR 0,94±0,05 0,91±0,09 0,94±0,04 0,92±0,06 0,93±0,04 0,86±0,09
CDP 0,94±0,04 0,93±0,06 0,95±0,04 0,91±0,05 0,92±0,05 0,90±0,07
Tabela 5-7: Índices de desempenho de RL para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 40% de treino para as diferentes classes de cor.
40% Treino ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
AUC 0,94±0,02 1,00±0,00 0,96±0,02 0,87±0,05 0,98±0,02 0,92±0,04
ACC 0,94±0,02 0,99±0,01 0,94±0,02 0,90±0,03 0,99±0,01 0,92±0,02
SPC 0,95±0,02 0,99±0,01 0,94±0,02 0,92±0,03 1,00±0,00 0,93±0,02
TPR 0,89±0,05 0,98±0,02 0,93±0,04 0,78±0,10 0,96±0,04 0,83±0,09
CDP 0,91±0,04 0,99±0,01 0,93±0,04 0,83±0,07 0,97±0,03 0,87±0,06
Para os modelos de classificação de texturas, foi definido previamente que seriam necessários 20%
de dados de treino para modelação dos descritores do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓, e nas Tabela 5-8,
Tabela 5-9 e Tabela 5-10 são apresentados os índices de desempenho para os diferentes modelos
considerados.
Tabela 5-8: Índices de desempenho de GK para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 20% de treino para as diferentes classes de textura.
20% Treino MH PH NH
AUC 0,9±0,03 0,86±0,02 0,97±0,02
ACC 0,84±0,03 0,8±0,02 0,93±0,01
SPC 0,85±0,05 0,79±0,06 0,94±0,02
TPR 0,8±0,08 0,8±0,05 0,91±0,07
CDP 0,82±0,07 0,8±0,05 0,92±0,05
55
Tabela 5-9: Índices de desempenho de FCM para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 20% de treino para as diferentes classes de textura.
20% Treino MH PH NH
AUC 0,9±0,02 0,8±0,05 0,97±0,02
ACC 0,83±0,03 0,74±0,05 0,93±0,01
SPC 0,84±0,05 0,72±0,08 0,94±0,02
TPR 0,8±0,08 0,75±0,07 0,91±0,07
CDP 0,82±0,07 0,74±0,07 0,92±0,05
Tabela 5-10: Índices de desempenho de RL para 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 com 20% de treino para as diferentes classes de textura.
20% Treino MH PH NH
AUC 0,93±0,01 0,67±0,03 0,97±0,02
ACC 0,86±0,02 0,61±0,04 0,93±0,01
SPC 0,86±0,04 0,6±0,06 0,94±0,02
TPR 0,84±0,08 0,62±0,07 0,91±0,07
CDP 0,85±0,06 0,61±0,07 0,92±0,05
Relacionando os resultados anteriores e a Figura 5-8 presente na secção 5.3.2 é possível concluir
quais os melhores resultados obtidos de modelação dos sistemas de classificação. Para a
classificação de cor, consegue fazer-se uma análise qualitativa dos resultados apresentados na
Figura 5-8 a), em que o modelo fuzzy TS baseado em FCM clustering apresenta os melhores
resultados do índice de desempenho CDP com valores de AUC e ACC superiores ou iguais a 0,95 e
0,9, respetivamente, em todas as classes de cor.
Na análise para os classificadores de textura apresentados na Figura 5-8 b), o modelo fuzzy TS
baseado em GK clustering apresenta os melhores resultados de CDP e toma valores de AUC e
ACC superiores ou iguais a 0,86 e 0,8, respetivamente, para todas as classes de textura.
5.6. Classificação de novas amostras
Para cada um dos cinco conjuntos de dados de modelação foram escolhidos os modelos que
obtiveram os melhores valores CDP de todas as combinações possíveis para as diferentes
percentagens de dados de treino referentes a cada classificador de cor e textura. No entanto, para
avaliar a classificação das amostras pertencentes aos conjuntos de verificação, são calculadas
percentagens de erro para os diferentes tipos de sistemas de predição de classificação com diferentes
percentagens de dados treino. Assim é possível verificar se os resultados obtidos na fase de
modelação representam efetivamente uma boa classificação para amostras que nunca tiveram
“conhecimento”. A classificação de cor é considerada independente da classificação de textura, o que
pode resultar em diferentes técnicas de modelos de decisão.
56
5.6.1. Classificação de cor dos conjuntos de amostras de
verificação
Cada conjunto de verificação para a classificação de cor contem 98 amostras e dado que existem
cinco diferentes subconjuntos de modelação e verificação só se podem avaliar os resultados de
classificação para o conjunto de dados de verificação complementares de cada conjunto de
modelação.
Para a classificação de cor, as novas amostras podem ser classificadas numa das classes
existentes ou em nenhuma delas. Cada classificador de cor, 𝐶𝑐𝑜𝑟 tem associado um valor de threshold
𝑡𝐶𝑐𝑜𝑟 , calculado na fase de treino, para transformar o resultado real 𝑝𝐶𝑐𝑜𝑟 (𝑛) num valor booleano
𝑝′𝐶𝑐𝑜𝑟 (𝑛) (equação 4.16) e definir a classe a que a amostra 𝑛 pertence. Na fase de modelação o
modelo fuzzy baseado na técnica de clustering FCM com 40% de dados de treino para a família de
descritores 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 apresentou o melhor desempenho na previsão de classificação de cor para
novas amostras e na Figura 5-9 estão representados os resultados dos valores de pertença das novas
amostras 𝑝𝐶𝑐𝑜𝑟 (𝑛), o valor esperado 𝑉𝑝𝐶𝑐𝑜𝑟 (𝑛) e o threshold 𝑡𝐶𝑐𝑜𝑟 para as respetivas classes.
Figura 5-9: Resultados obtidos dos seis classificadores de cor para 98 novas amostras.
Para verificar qual o modelo que prevê a melhor classificação das amostras de mármore nas
diferentes cores consideradas neste trabalho, calculam-se as percentagens de erro através da
equação 5.1, tal como os valores médios e desvios padrão dos diferentes conjuntos de dados de
verificação (𝐾𝑐𝑜𝑛𝑗) para 𝑝𝑡 = 2, referente a 40% de treino, e 𝑀 = 2, ao modelo FCM.
%𝑒𝑟𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑖𝑓𝑖𝑐𝑎çã𝑜 = 𝑒𝑝𝑡,𝑀 =∑[𝑉𝑝𝑐(𝑛)≠𝑝′𝑐(𝑛)]
𝑁𝑎 (5.1)
Classificação Prevista Classificação Real Threshold de classificação positiva
Observações
Val
ore
s d
e P
erte
nça
ED_Art_Deco ED_Rosa ED_Trovoada
Observações
Val
ore
s d
e P
erte
nça
ED_Pastel FM_Art_Deco FM_Sunset
57
Desta forma, calcula-se para todas as combinações de 𝑝𝑡 e 𝑀 o valor de 𝑒𝑝𝑡,𝑀. Advém de um
conjunto de resultados (Tabela 5-11) que vai refletir a escolha do melhor modelo de
classificação de cor.
Tabela 5-11: Resultados de 𝒆𝒑𝒕,𝐌 para classificação de cor.
GK FCM RL
20% 14,58±4,09 5,76±2,50 8,43±4,04
40% 3,90±1,14 4,93±2,24 6,37±1,52
60% 3,09±2,53 4,93±1,99 6,17±2,08
80% 2,88±1,70 5,35±2,25 5,96±1,71
O valor realçado a vermelho refere-se ao melhor modelo de classificação previsto na fase de treino
e o valor a negrito refere-se ao melhor resultado obtido de todas as combinações de modelos e
percentagens de treino. Dado que o melhor resultado é para uma percentagem de treino de 80%,
considera-se que é um valor muito elevado para fazer uma pré classificação dos mármores,
correspondendo a aproximadamente 45 amostras para cada cor. Assim, considerou-se 40% de dados
de treino como a melhor percentagem, o que corresponde a 26 amostras a serem pré classificadas
para cada classe de cor, e para o modelo fuzzy baseado na técnica de clustering GK o erro médio de
classificação é de 3,9%, o que corresponde a menos 1,03% para o melhor resultado obtido.
No anexo C.1 apresentam-se as imagens classificadas do conjunto de verificação que obteve o
menor erro de classificação para os múltiplos classificadores de cor baseados no modelo fuzzy com
sistemas de inferência baseadas na técnica de clustering GK com 40% de dados de treino.
5.6.2. Classificação de textura dos conjuntos de amostras de
verificação
Como apresentado anteriormente, existem cinco conjuntos de dados de verificação e as amostras
de cada conjunto só podem ser classificadas para os modelos produzidos pelos respetivos conjuntos
de modelação.
Para a classificação de textura, as novas amostras terão de ser classificadas numa das classes
existentes, considerando o maior valor obtido de 𝑝𝐶𝑡𝑥𝑡(𝑛) de cada amostra 𝑛 para os diferentes
classificadores de textura 𝐶𝑡𝑥𝑡. Na fase de modelação o modelo fuzzy baseado na técnica de clustering
GK com 20% de dados de treino para a família de descritores 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 apresentou o melhor
desempenho na previsão de classificação de textura para novas amostras e na Figura 5-10 estão
representados os resultados dos valores de pertença das novas amostras 𝑝𝐶𝑡𝑥𝑡(𝑛) e o valor esperado
𝑉𝑝𝐶𝑡𝑥𝑡(𝑛) para as respetivas classes de textura.
58
Figura 5-10: Resultados obtidos dos três classificadores de textura para 98 novas amostras.
Considerando novamente a percentagem de erro de classificação (equação 5.1), para todas as
combinações de 𝑝𝑡 e 𝑀 foram calculados os valores de 𝑒𝑝𝑡,𝑀. A Tabela 5-12 apresenta um conjunto
de resultados que reflete a escolha do melhor modelo de classificação de textura.
Tabela 5-12: Resultados de 𝒆𝒑𝒕,𝑴 para classificação de textura.
GK FCM RL
20% 16,46 ± 5,63 17,29 ± 6,24 28,15 ± 6,25
40% 18,30 ± 5,12 16,25 ± 4,22 30,82 ± 4,95
60% 17,69 ± 4,10 17,89 ± 4,49 32,05 ± 7,78
80% 17,29 ± 6,11 19,94 ± 4,98 31,65 ± 6,80
O valor realçado a vermelho refere-se ao melhor modelo de classificação previsto na fase de treino
e o valor a negrito refere-se ao melhor resultado obtido de todas as combinações de modelos e
percentagens de treino. O melhor resultado é para uma percentagem de treino de 40%,
correspondendo a aproximadamente 55 amostras para cada textura. No entanto não apresenta um
erro consideravelmente menor que o resultado obtido pelo modelo que previu as melhores
classificações na fase de modelação, recorrendo a 20% de dados para treino Assim, considerou-se
20% de dados de treino como a melhor percentagem, o que corresponde a 28 amostras a serem pré
classificadas para cada classe de textura, para classificadores modelados por um modelo fuzzy
baseado na técnica de clustering GK. O erro médio de classificação é de 16,46%, o que apesar de
ser um valor substancial poderá apresentar uma classificação mais precisa do que o que se apresenta
na pré-classificação, dado a subjetividade do critério de textura.
No anexo C.2 apresentam-se as imagens classificadas do conjunto de verificação que obteve o
menor erro de classificação para os múltiplos classificadores de textura baseados no modelo fuzzy
com sistemas de inferência baseadas na técnica de clustering GK com 20% de dados de treino.
Classificação Prevista Classificação Real
Observações
Val
ore
s d
e P
erte
nça
Muito Homogéneo Pouco Homogéneo Nada Homogéneo
59
5.6.3. Classificação de cor e textura de amostras não
consideradas no estudo dos modelos de decisão
Adotando a metodologia da classificação de amostras pré classificadas nas diferentes classes de
cor e textura foram consideradas agora as 108 amostras rejeitadas no início do estudo. Estas
amostras são denominadas de ED_Construção, ED_Medio, ED_Trovoada_Medio, ED_Aguarela e
FM_Rajada. A Figura 5-11 apresenta as amostras modelo para cada uma destas famílias de cor de
mármore consideradas neste trabalho e na Figura 5-12 as diferentes famílias de cor das novas
amostras.
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
Figura 5-11: Amostras modelo das diferentes famílias de mármore estudadas.
ED_Construção ED_Medio ED_Trovoada_Medio ED_Aguarela FM_Rajada
Figura 5-12: Amostras modelo das diferentes famílias de mármore das amostras rejeitadas.
Através das imagens apresentadas percebe-se que as famílias presentes na Figura 5-12, apesar
de não terem sido consideradas para o estudo, devido à pequena quantidade de amostras
disponíveis, têm algumas semelhanças com as famílias de mármore dos modelos de classificação
considerados neste trabalho.
Este estudo pretende concluir se com os classificadores de textura criados conseguem distinguir-
se os diferentes níveis de homogeneidade dos mármores e se as classificações de cor são aceitáveis
dado que não pertencem a nenhuma das famílias de cor previamente conhecidas. Através de uma
análise qualitativa das amostras alocadas em diferentes conjuntos de cor (Figura 5-13) e textura
(Figura 5-14), é possível concluir quanto à qualidade do sistema de classificação automática para
amostras, nunca antes consideradas, comparando com algumas amostras modelo dessas mesmas
classes.
ED_Construcao ED_Medio ED_Trovoada_Medio ED_Aguarela FM_Rajada
60
Com esta análise qualitativa, pode concluir-se que a classificação obtida para as diferentes classes
de cor e textura das amostras rejeitadas apresentam boas semelhanças nas diferentes classes.
a) Modelos de a)
b) Modelos de b)
c) Modelos de c)
d) Modelos de d)
61
e)
Figura 5-13: Classificação de cor das amostras rejeitadas. a) ED_Art_Deco; b) ED_Rosa; c) FM_Art_Deco; d) FM_Sunset; e) Indiferenciado.
a)
62
b)
c)
Figura 5-14: Classificação de textura das amostras rejeitadas. a) Muito Homogéneo; b) Pouco Homogéneo; c) Nada Homogéneo.
63
Conclusões e Trabalho Futuro
Este trabalho foi realizado com o intuito de estudar uma nova forma de classificar pedras de
mármore polidas para resolver um problema atual na fase de classificação na indústria. Sugere-se
uma classificação automática de ladrilhos de mármores através de semelhanças de cor e textura, de
uma forma rápida e precisa.
O estudo considerou um sistema de múltiplos classificadores referentes a cada classe de cor e
textura que os operadores especializados da fábrica pré classificaram. Desta forma torna-se possível
generalizar este trabalho para qualquer galeria de mármores, dado que cada classificador representa
uma única classe. Este método é vantajoso porque assim cada fábrica pode criar os seus
classificadores dependendo dos mármores que obtêm, com a possibilidade de se puder adicionar
uma nova classe de cor sem despender um intervalo de tempo elevado a treinar novamente os
classificadores já definidos. Também se apresenta como vantagem o facto de o utilizador puder
escolher quais os classificadores que pretende considerar na classificação de novos mármores,
diminuindo o erro de classificação ao considerar todas as classes.
A obtenção dos descritores dos mármores digitalizados teve em conta as principais características
de cor e textura que os operadores avaliam e como tal recorreu-se a uma segmentação QuadTree
para extrair informação sobre as venadas, homogeneidade e as cores predominantes das pedras. O
estudo dos critérios de decomposição para a segmentação são importantes dado que existe a
necessidade de uma classificação célere, não perdendo informação importante das pedras. Estudos
anteriores utilizaram descritores de cor globais e como tal foram considerados 12 descritores de cor
baseados nas médias e desvios padrão do espaço de cores RGB e HSV para criar um conjunto de
descritores mais completo.
A implementação de técnicas de classificação teve em consideração os diversos estudos feitos
sobre o tema e assim consideram-se três métodos de modelação baseados em: Regressão Logística
(RL) e modelos fuzzy baseados em sistemas de inferência Takagi-Sugeno (TS) de primeira ordem
com técnicas de clustering Gustafson-Kessel (GK) e Fuzzy c-Mean (FCM). Foram consideradas duas
fases para obter os melhores classificadores de cor e textura das amostras disponíveis, que
constituem 6 classes de cor e 3 de textura. Na fase de modelação avalia-se para os diferentes
modelos de decisão e diferentes percentagens de dados de treino a qualidade de classificação
prevista e, posteriormente na fase de verificação, com as amostras que não foram consideradas na
fase anterior, classificam-se através dos classificadores que obtêm os melhores resultados do critério
de desempenho ponderado (CDP) na fase de modelação. Assim é possível avaliar a classificação de
novas amostras de mármore através de uma percentagem de erro e definir a quantidade de amostras
necessárias para construir os múltiplos classificadores. Foi considerado o conjunto 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 de
descritores como os que obtiveram melhores resultados na fase de modelação.
Com todos os parâmetros anteriores considerados, obteve-se a melhor percentagem de erro na
fase de verificação dos múltiplos classificadores de cor modelados com 40% de dados para treino,
que equivale a 26 amostras de cada classe de cor, através de um modelo fuzzy baseado num sistema
64
de inferência TS de primeira ordem com a técnica de clustering GK, resultando de 3,9% de
classificações erradas. Para a classificação de textura resultaram 16,46% de classificações erradas
dos dados de verificação para os múltiplos classificadores modelados com 20% de dados de treino,
que equivale a 28 amostras de cada classe de textura, através do mesmo modelo considerado para
a classificação de cor.
A comparação destes resultados com outros trabalhos anteriormente desenvolvidos não foi trivial
uma vez que se basearam somente nos resultados da fase de modelação e este trabalho apresenta
resultados da fase de classificação. No entanto, no trabalho desenvolvido em 2004 por Sousa et al
[14] obtiveram-se percentagens de erro da classificação de cor dos dados de teste para modelos
baseados em redes neuronais de 19,9% e para a classificação de textura o melhor resultado foi para
modelos fuzzy TS otimizado com um algoritmo genético que obteve 20,9% de erro para os dados de
teste. Assim conclui-se que o método de múltiplos classificadores desenvolvido neste trabalho
consegue classificar novas amostras de mármores com uma melhor precisão.
O tempo de classificação torna-se irrelevante comparativamente com o tempo de extração de
descritores das imagens. Com o parâmetro de segmentação dos mármores que melhor caracterizam
em termos de cor e textura, pode afirmar-se que os descritores que constituem cada amostra no
conjunto 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 têm um intervalo de tempo computacional entre 0,67s e 20,08s dependendo do
grau de homogeneidade do ladrilho. Apresenta-se como um dos principais resultados a cadência da
classificação automática que varia entre 180 e 5300 mármores por hora, através do computador
utilizado neste estudo (especificações presentes na Tabela 3-1), o que torna muito apelativo dado
que um operador consegue classificar em média 80 ladrilhos de mármores por hora.
No seguimento deste estudo, é proposto que este sistema seja implementado no protótipo
StoneScan, adaptando todo o código desenvolvido em Matlab para C e por sua vez ligado a uma
interface com o utilizador. O sistema de classificação por múltiplos classificadores desenvolvido
apresenta bons resultados para o conjunto de dados considerados neste trabalho, no entanto será
necessário verificar se os resultados de classificação são efetivamente generalizados para outras
galerias de mármores. Para melhorar o desempenho do sistema na classificação de textura, propõe-
se que seja estudado outro tipo de descritores que representem melhor as características de
homogeneidade dos mármores e para os descritores de cor fazer um estudo de quais as
características mais relevantes. O modelo de decisão proposto neste trabalho, apesar de apresentar
bons resultados na classificação de novos mármores, pode ser otimizado com outros algoritmos de
clustering.
O trabalho desenvolvido nesta dissertação deu origem a um artigo científico que foi aceite para
“21th edition of the Portuguese Conference on Pattern Recognition” (RecPad2015).
.
65
Bibliografia
[1] S. M. Marcora, W. Staiano e V. Manning, “Mental fatigue impairs physical performance in
humans,” Journal of Applied Physiology, vol. 106 no. 3, pp. 857-864, 2009.
[2] E. M.Winkler, “Weathering and weathering rates of natural stone,” Environmental Geology
and Water Sciences, Volume 9, Issue 2, pp. 85-92, 1987.
[3] H. A. e. P. Centro de Estudos de Cultura, “CECHAP,” 14 Junho 2012. [Online]. Available:
http://www.cechap.com/index.php/projectos/item/15-him.
[4] P. Smitha, L. Shaji e M. G. Dr. Mini, “A Review of Medical Image Classification
Techniques,” International Journal of Computer Applications, pp. 34-38, 2011.
[5] M. Erdogan, “Measurement of polished rock surface brightness by image tile
classification,” Engineering Geology, vol. 57, pp. 65-72, 2000.
[6] P. L. Carrilho e S. Turchetta, “An automatic visual system for marble tile classification,”
Journal of engineering Manufacture, vol. 216, pp. 1095-1108, 2002.
[7] L. Cinque, G. Ciocca, S. Levialdi, A. Pellicanò e R. Schettini, “Color-based image retrieval
using spatial-chromatic histograms,” Image and Vision Computing, vol. 19, pp. 979-986,
2001.
[8] H. Alexandre e J. Caldas Pinto, “New Wavelets based features for natural surface
indexing,” First International Conference on Computer Vision theory and Applications, pp.
311-316, 25-28 February 2006.
[9] J. Luis-Delgado, J. Martínez-Alajarín e L. Tomas-Balibrea, “Classification of marble
surfaces using wavelets,” Electronic Letters, vol. 39, pp. 714-715, 2003.
[10] J. L. Sobral, “Leather Inspection Based on Wavelets,” IbPRIA, pp. 682-688, 2005.
[11] J. Caldas Pinto, A. Marcolino e A. Ramalho, “Clustering Algorithm for color segmentation,”
V Ibero American Symposium on Patterin Recognition, pp. 123-135, 11-13 Setembro 2000.
[12] J. R. Caldas Pinto, P. Pina, V. Ramos e M. Ramalho, “Clustering Techiques for Marble
Classification,” 12th Portuguese Conference on Pattern Recognition, 27-28 Junho 2002.
[13] J. R. Caldas Pinto, J. M. Sousa e H. Alexandre, “New Distance Measures Applied to
Marble Classification,” Progress in Pattern Recognition Speech and Image Analysis, pp. 383-
390, 2003.
[14] J. M. C. Sousa e J. R. Caldas Pinto, “Comparison of Intelligent Classification Techniques
Applied to Marble Classification,” Image Analysis and Recognition, pp. 802-809, 2004.
66
[15] N. Benavente e P. Pina, “Morphological segmentation and classification of marble textures
at macroscopical scale,” Computers and Geociences, vol. 35, pp. 1194-1204, 2009.
[16] T. Barata e P. Pina, “A morphological approach for feature space partitioning,” IEEE
Geoscience and Remote Sensing Letters, vol. 3, pp. 173-177, 2006.
[17] J. Martínez-Cabeza-de-Vaca-Alajarín e L.-M. Tomás-Balibrea, “Marble Slabs Quality
Classification System using Texture Recognition and Neural Networks Methodology,”
European Symposium on Artificial Neural Networks, pp. 75-80, 21-23 Abril 1999.
[18] I. Topalova, “Automated Marble Plate Classification System Based on Different Neural
Network Input Trainnig Sets and PLC Implementation,” International Journal of Advancer
Research ir Artificial Intelligence, vol. 1, pp. 50-56, 2012.
[19] R. Datta, D. Joshi, J. Li e J. Z. Wang, “Image Retrieval: Ideas, Influences and Trends of
the New Age,” ACM Comouting Surveys, vol. 40 no. 2, pp. 1-60, 2008.
[20] G. S. Linoff e M. J. Berry, Data mining techniques: for marketing, sales, and customer
relationship management, John Wiley & Sons, 2004.
[21] U. Fayyad, G. Piatetsky-Shapiro e P. Smyth, “From data mining to Knowledge discovery
in Databases,” AI Magazine, vol. 17 no. 3, pp. 37-54, 1996.
[22] S. Chakrabarti, E. Cox, E. Frank, R. H. Gûting, J. Han, X. Jiang, M. Kamber, S. S.
Lightstone, T. P. Nadeau e R. E. Neapolitan, Data Mining: know it all, Burlington: Morgan
Kaufmann, 2008.
[23] I. Guyon e A. Elissef, “An Introduction to Variable and Feature Selection,” Journal of
Machine Learning Research, vol. 3, pp. 1157-1182, 2003.
[24] I. Guyon, M. Nikravesh, S. Gunn e L. A. Zadeh, Feature Extraction: Foundations and
Applications, Berlin Heidelberd: Springer, 2006.
[25] C. M. Bishop, Pattern Recognition and Machine Learning, Springer, 2006.
[26] H. Adbi e L. J. Williams, “Principal component analysis,” em Interdisciplinary reviews:
Computational Statistics, Wiley, 2010, pp. 433-459.
[27] P. A. Devijver e J. Kittler, Pattern recognition: A statistical approach, London: Prentice-
Hall, 1982.
[28] L. I. Kuncheva, Combining Pattern Classifiers: Methods and Algorithms, New Jersey: John
Wiley and Sons, 2004.
[29] T. Hastie, R. Tibshirami e J. Friedman, “The Elements of Statistical Learning,” em Data
Mining, Inference and Prediction, Stanford, California, Springer, 2008.
67
[30] Y. Zhang e Y. Yang, “Cross-validation for selecting a model selection procedure,” Journal
of Econometrics, vol. 187, pp. 95-112, 2015.
[31] S. V. Stehman, “Selecting and Interpreting Measures of Thematic Classification Accuracy,”
Remote Sensing of Environment, vol. 62, pp. 77-89, 1997.
[32] E. W. Steyerberg, A. J. Vickers, N. R. Cook, T. Gerds, M. Gonen, N. Obuchowski, M. J.
Pencina e M. W. Kattan, “Assessing the performance of prediction models: a framework for
some traditional and novel measures,” Epidemiology, vol. 21, pp. 128-138, 2010.
[33] A. S. Fialho, F. Cismondi, S. M. Vieira, S. R. Reti, J. M. Sousa e S. N. Finkelstein, “Data
mining using clinical physiology at discharde to predict ICU readmissions,” Expert Systems
with Applications, pp. 13158-13165, 2012.
[34] R. D. Pereira, C. M. Salgado, A. Dejam, S. R. Reti, S. M. Vieira, J. M. Sousa, L. A. Celi e
S. N. Finkelstein, “Fuzzy Modeling to Predict Severely Depressed Left Ventricular Ejection
Fraction following Admission to the Intensive Care Unit Using Clinical Physiology,” The
Scientific World Journal, Hindawi, 2015.
[35] J. L. Viegas, S. M. Vieira e J. M. Sousa, “Fuzzy clustering and prediction of electricity
demand based on household characteristics,” 16th World Congress of the International Fuzzy
Systens Association, 2015.
[36] T. Kumar e K. Verma, “A Theory Based on Conversion of RGB image to Gray image,”
International Journal of Compiter Applications, vol. 7 no.2, pp. 7-10, 2010.
[37] A. R. Smith, “Color gamut transform pairs,” ACM SIGGRAPH Computer Graphics, vol. 12
no.12, pp. 12-19, 1978.
[38] R. Keys, “Cubic convolution interpolation for digital image processing,” Acoustics, Speech
and Signal Processing, vol. 29, pp. 1153-1160, 1981.
[39] L. Chandrika, “Implementation Image Retrieval and Classification with SURF Technique,”
International Journal of Innovative Science, Engineering and Technology, vol. 1, pp. 280-284,
2014.
[40] G. Dorko e C. Schmid, “Selection of scale-invariant parts for object class recognition,”
Computer Vision, vol. 1, pp. 634-638, 2003.
[41] K. Mikolajczyk e C. Schmid, “Scale and Affine Invariant Interest Point Detectors,”
International Journal of Computer Vision, vol. 60, pp. 63-86, 2004.
[42] M. Calonder, V. Lepetit, C. Strecha e P. Fua, “BRIEF: Binary Robust Independent
Elementary Features,” Computer Vision - ECCV 2010, vol. 6314, pp. 778-792, 2010.
68
[43] M. Calonder, V. Lepetit e P. Fua, “Keypoint Signatures for Fast Learning and Recognition,”
Compurter Vision - ECCV 2008, vol. 5302, pp. 58-71, 2008.
[44] F. P. Incropera, D. P. Dewitt, T. L. Bergman e A. S. Lavine, Fundamentals of Heat and
Mass Transfer, New Delhi: Wiley India, 2013.
[45] G. H. Joblove e D. Greenberg, “Color spaces for computer graphics,” Computer gra+hics
and interative tecnhiques, vol. 12, pp. 20-25, 1978.
[46] Z. Qiang, Y. Jie, Y. Jingyi e L. Hongxing, “Stone Images Retrieval Based on Color
Histogram,” Image Analysis and Signal Processing, pp. 157-161, 2009.
[47] T. Alphonsa e A. Sreekumar, “A Survey on Image Feature Descriptors-Color, Shape and
Texture,” International Journal of Computer Science and Information Technologies, vol. 5, pp.
7847-7850, 2014.
[48] G. Pass, R. Zabih e J. Miller, “Comparing Images using Color Coherence Vectors,”
Proceedings of the fourth ACM international conference on Multimedia, pp. 65-73, 1997.
[49] P. C. Chen e T. Pavlidis, “Segmentation by texture using a co-occurence matrix and a
split-and-merge,” Computer Graphics and Image Processing, vol. 10, pp. 172-182, 1972.
[50] R. Haralick, K. Shanmugam e I. Dinstein, “Textual Features for image classification,”
Systems, Man ang Cybernetics, vol. 3 SMC, pp. 610-621, 1973.
[51] H. Samet, “The Quadtree and Related Hierarchical Data Structures,” ACM Computing
Surveys, vol. 16, pp. 187-260, 1984.
[52] M. Gong e Y.-H. Yang, “Quadtree-based genetic algorithm and its applications to computer
vision,” The Journal of the Pattern Recognition Society, vol. 37, pp. 1723-1733, 2004.
[53] D. R. Cox, “The regression analysis of binary sequences (with discussion),” J Roy Stat
Soc B, vol. 20, pp. 215-242, 1958.
[54] D. W. Hosmer e S. Lemeshow, Applied Logistic Regression, Second Edition, John Wiley
and Sons, Inc, 2000.
[55] J. S. Cramer, Logit Models from Economics and Other Fields, Cambridge: Cambridge
University Press, 2003.
[56] J. M. Sousa e U. Kaymak, Fuzzy decision making in modeling and control, Singapura:
World Scientific, 2002.
[57] T. Takagi e M. Sugeno, “Fuzzy Identification of Systems and its Application to Modeling
and Control,” IEEE Transactions on Systems, Man and Cybernetics, vol. 15 SMC no.1, pp.
116-132, 1985.
69
[58] R. Babuska, Fuzzy modeling for control, Kluwer Academic Publishers, 1998.
[59] U. Kaymak, “Extended Fuzzy Clustering Algorithms,” ERIM Report Series Research in
Management, p. 24, 2000.
[60] J. C. Bezdek, Pattern recognition with fuzzy objective function algorithms, USA: Kluwer
Academic Publishers, 1981.
[61] J. C. Bezdek, R. Ehrlich e W. Full, “FCM: the Fuzzy c-Means clustering algorithm,”
Computers and Geociences, vol. 10, pp. 191-203, 1984.
[62] R. N. Pal e J. C. Bezdek, “On cluster validity for the fuzzy c-means model,” IEEE
Computational Intelligence Society, vol. 3, pp. 370-379, 1995.
[63] J. C. Dunn, “A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact
Well-Separated Clusters,” Cybernetic and Systems, vol. 3, pp. 32-57, 1973.
[64] D. E. Gustafson e W. C. Kessel, “Fuzzy clustering with fuzzy covariance matrix,” Decision
and Control including the 17th Symposium on Adaptative Process, pp. 761-766, 1978.
[65] S. É. Parent, L. E. Parent, D. E. Rozanne, A. Hernandes e W. Natale, Nutrient Balance as
Paradigm of Soil and Plant Chemometrics, 2012.
[66] M. Galar, A. Fernández, E. Barrenechea, H. Bustince e F. Herrera, “An overview od
ensemble methods for binary classifiers in multi-class problems: Ezperimental study on one-
vs-one and one-vs-all schemes,” Pattern Recognition, vol. 44, pp. 1761-1776, 2011.
70
I
Anexos
Anexo A - Valores quantitativos dos diferentes métodos de clustering para a definição da quantidade de clusters a considerar para os múltiplos classificadores.
A.1. GK clustering.
A 1: Resultados de CDP da Classe ED_Art_Deco para modelo fuzzy com GK clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,77±0,12 0,58±0,14 0,61±0,13 0,66±0,12
40% Treino 0,91±0,07 0,81±0,10 0,73±0,11 0,66±0,09
60% Treino 0,92±0,05 0,87±0,09 0,86±0,10 0,79±0,12
80% Treino 0,93±0,06 0,92±0,06 0,91±0,09 0,87±0,10
A 2: Resultados de CDP da Classe ED_Rosa para modelo fuzzy com GK clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,79±0,14 0,79±0,16 0,83±0,15 0,86±0,11
40% Treino 0,92±0,11 0,87±0,13 0,84±0,13 0,80±0,14
60% Treino 0,98±0,03 0,95±0,08 0,91±0,10 0,85±0,13
80% Treino 0,98±0,03 0,97±0,05 0,96±0,06 0,93±0,07
A 3: Resultados de CDP da Classe ED_Trovoada para modelo fuzzy com GK clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,84±0,07 0,62±0,12 0,62±0,11 0,70±0,10
40% Treino 0,94±0,03 0,92±0,04 0,84±0,08 0,72±0,10
60% Treino 0,96±0,02 0,95±0,03 0,92±0,04 0,89±0,05
80% Treino 0,97±0,03 0,96±0,03 0,94±0,03 0,93±0,05
A 4: Resultados de CDP da Classe ED_Pastel para modelo fuzzy com GK clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,67±0,12 0,60±0,12 0,64±0,13 0,66±0,13
40% Treino 0,87±0,07 0,73±0,11 0,68±0,11 0,65±0,10
60% Treino 0,88±0,07 0,84±0,10 0,79±0,11 0,72±0,10
80% Treino 0,91±0,08 0,88±0,09 0,88±0,09 0,80±0,12
A 5: Resultados de CDP da Classe FM_Art_Deco para modelo fuzzy com GK clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,80±0,13 0,83±0,13 0,87±0,13 0,88±0,10
40% Treino 0,77±0,14 0,76±0,13 0,77±0,14 0,76±0,14
60% Treino 0,86±0,13 0,78±0,12 0,77±0,12 0,75±0,13
80% Treino 0,96±0,08 0,83±0,13 0,78±0,16 0,77±0,14
A 6: Resultados de CDP da Classe FM_Sunset para modelo fuzzy com GK clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,73±0,11 0,59±0,10 0,58±0,12 0,65±0,12
II
40% Treino 0,86±0,09 0,76±0,11 0,69±0,10 0,66±0,10
60% Treino 0,90±0,07 0,85±0,10 0,79±0,11 0,74±0,11
80% Treino 0,91±0,08 0,87±0,10 0,88±0,10 0,81±0,12
A 7: Resultados de CDP da Classe Muito Homogéneo para modelo fuzzy com GK clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,74±0,04 0,73±0,05 0,72±0,06 0,72±0,06
40% Treino 0,75±0,03 0,75±0,04 0,76±0,04 0,76±0,04
60% Treino 0,75±0,05 0,76±0,05 0,77±0,05 0,77±0,05
80% Treino 0,75±0,08 0,77±0,08 0,77±0,08 0,77±0,08
A 8: Resultados de CDP da Classe Pouco Homogéneo para modelo fuzzy com GK clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,75±0,04 0,75±0,03 0,74±0,04 0,72±0,03
40% Treino 0,77±0,03 0,76±0,03 0,76±0,03 0,76±0,03
60% Treino 0,78±0,03 0,77±0,03 0,77±0,03 0,77±0,03
80% Treino 0,78±0,05 0,78±0,05 0,77±0,05 0,77±0,05
A 9: Resultados de CDP da Classe Nada Homogéneo para modelo fuzzy com GK clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,88±0,04 0,86±0,06 0,84±0,06 0,84±0,07
40% Treino 0,90±0,03 0,89±0,03 0,89±0,04 0,88±0,04
60% Treino 0,91±0,03 0,90±0,03 0,90±0,03 0,90±0,04
80% Treino 0,91±0,04 0,91±0,05 0,91±0,05 0,90±0,05
A.2. FCM clustering.
A 10: Resultados de CDP da Classe ED_Art_Deco para modelo fuzzy com FCM clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,89±0,04 0,55±0,17 0,62±0,12 0,59±0,11
40% Treino 0,94±0,03 0,88±0,12 0,65±0,13 0,61±0,10
60% Treino 0,95±0,03 0,94±0,05 0,76±0,13 0,68±0,12
80% Treino 0,95±0,04 0,95±0,04 0,80±0,14 0,73±0,13
A 11: Resultados de CDP da Classe ED_Rosa para modelo fuzzy com FCM clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,75±0,15 0,55±0,19 0,65±0,11 0,63±0,14
40% Treino 0,89±0,06 0,69±0,13 0,66±0,12 0,62±0,12
60% Treino 0,92±0,05 0,76±0,12 0,70±0,11 0,65±0,11
80% Treino 0,92±0,07 0,77±0,13 0,72±0,13 0,68±0,14
A 12: Resultados de CDP da Classe ED_Trovoada para modelo fuzzy com FCM clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,90±0,05 0,47±0,11 0,58±0,11 0,66±0,09
40% Treino 0,96±0,02 0,87±0,07 0,74±0,09 0,68±0,09
III
60% Treino 0,97±0,02 0,90±0,05 0,80±0,08 0,72±0,07
80% Treino 0,97±0,03 0,90±0,07 0,81±0,09 0,74±0,10
A 13: Resultados de CDP da Classe ED_Pastel para modelo fuzzy com FCM clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,84±0,07 0,53±0,17 0,58±0,13 0,59±0,13
40% Treino 0,91±0,03 0,84±0,09 0,72±0,13 0,55±0,11
60% Treino 0,91±0,03 0,90±0,07 0,79±0,11 0,59±0,14
80% Treino 0,92±0,06 0,91±0,07 0,82±0,12 0,64±0,16
A 14: Resultados de CDP da Classe FM_Art_Deco para modelo fuzzy com FCM clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,85±0,10 0,57±0,21 0,68±0,13 0,66±0,12
40% Treino 0,91±0,02 0,81±0,12 0,68±0,12 0,66±0,13
60% Treino 0,92±0,03 0,81±0,13 0,68±0,12 0,67±0,12
80% Treino 0,92±0,05 0,83±0,15 0,68±0,15 0,64±0,15
A 15: Resultados de CDP da Classe FM_Sunset para modelo fuzzy com FCM clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,87±0,05 0,55±0,17 0,70±0,11 0,61±0,11
40% Treino 0,92±0,05 0,89±0,05 0,83±0,10 0,63±0,11
60% Treino 0,94±0,03 0,93±0,04 0,91±0,06 0,68±0,11
80% Treino 0,94±0,05 0,93±0,06 0,92±0,07 0,69±0,12
A 16: Resultados de CDP 4SPC da Classe Muito Homogéneo para modelo fuzzy com FCM clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,74±0,04 0,73±0,05 0,72±0,05 0,71±0,06
40% Treino 0,75±0,04 0,75±0,04 0,74±0,05 0,74±0,05
60% Treino 0,75±0,05 0,76±0,06 0,76±0,06 0,75±0,06
80% Treino 0,75±0,07 0,75±0,07 0,75±0,09 0,76±0,08
A 17: Resultados de CDP da Classe Pouco Homogéneo para modelo fuzzy com FCM clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,74±0,04 0,74±0,04 0,74±0,04 0,73±0,04
40% Treino 0,76±0,03 0,76±0,03 0,76±0,03 0,75±0,03
60% Treino 0,77±0,03 0,77±0,03 0,77±0,04 0,76±0,03
80% Treino 0,77±0,05 0,77±0,05 0,77±0,05 0,76±0,05
A 18: Resultados de CDP da Classe Nada Homogéneo para modelo fuzzy com FCM clustering.
2 Clusters 3 Clusters 4 Clusters 5 Clusters
20% Treino 0,88±0,04 0,87±0,05 0,87±0,05 0,86±0,06
40% Treino 0,90±0,03 0,90±0,03 0,89±0,04 0,89±0,04
60% Treino 0,91±0,03 0,91±0,03 0,90±0,03 0,89±0,04
80% Treino 0,91±0,05 0,91±0,05 0,90±0,04 0,90±0,04
IV
V
Anexo B - Valores quantitativos dos diferentes modelos para a definição dos parâmetros a considerar na modelação dos múltiplos classificadores de cor e textura.
B.1. Definição da percentagem de treino
B 1: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Cor.
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
20% Treino 0,79±0,14 0,83±0,15 0,85±0,11 0,70±0,14 0,83±0,14 0,76±0,13
40% Treino 0,92±0,07 0,92±0,11 0,95±0,04 0,87±0,10 0,78±0,14 0,88±0,09
60% Treino 0,93±0,06 0,99±0,03 0,96±0,03 0,90±0,07 0,88±0,12 0,91±0,07
80% Treino 0,94±0,06 0,99±0,02 0,97±0,03 0,91±0,07 0,97±0,06 0,92±0,08
B 2: Resultados de CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Cor.
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
20% Treino 0,91±0,06 0,87±0,10 0,90±0,07 0,84±0,09 0,89±0,08 0,86±0,10
40% Treino 0,95±0,04 0,92±0,06 0,95±0,03 0,90±0,06 0,92±0,05 0,91±0,06
60% Treino 0,95±0,04 0,93±0,05 0,96±0,03 0,92±0,05 0,93±0,04 0,93±0,05
80% Treino 0,95±0,05 0,93±0,07 0,96±0,04 0,93±0,07 0,93±0,06 0,94±0,06
B 3: Resultados de CDP da Regressão Logística para as diferentes percentagens de Treino do conjunto
𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Cor.
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
20% Treino 0,89±0,05 0,98±0,02 0,93±0,04 0,82±0,07 0,97±0,02 0,85±0,07
40% Treino 0,91±0,04 0,99±0,01 0,94±0,04 0,83±0,06 0,97±0,02 0,89±0,06
60% Treino 0,92±0,05 0,99±0,01 0,94±0,04 0,84±0,08 0,98±0,03 0,89±0,06
80% Treino 0,92±0,07 0,99±0,01 0,94±0,04 0,85±0,10 0,98±0,03 0,90±0,07
B 4: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de Treino
do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Textura.
MH PH NH
20% Treino 0,756±0,075 0,763±0,060 0,899±0,061
40% Treino 0,765±0,059 0,775±0,051 0,912±0,045
60% Treino 0,766±0,064 0,781±0,052 0,916±0,045
80% Treino 0,767±0,088 0,781±0,070 0,918±0,057
B 5: Resultados de CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de
Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Textura.
MH PH NH
20% Treino 0,757±0,075 0,672±0,074 0,902±0,054
40% Treino 0,762±0,063 0,684±0,062 0,912±0,045
60% Treino 0,764±0,068 0,682±0,060 0,916±0,045
80% Treino 0,759±0,089 0,685±0,074 0,917±0,058
VI
B 6: Resultados de CDP da Regressão Logística para as diferentes percentagens de Treino do conjunto
𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟑 de descritores para classificação de Textura.
MH PH NH
20% Treino 0,765±0,071 0,629±0,065 0,894±0,059
40% Treino 0,770±0,058 0,634±0,054 0,907±0,045
60% Treino 0,772±0,064 0,634±0,056 0,910±0,045
80% Treino 0,773±0,078 0,634±0,042 0,912±0,049
B 7: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de Treino
do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
20% Treino 0,78±0,15 0,84±0,15 0,79±0,13 0,71±0,14 0,81±0,15 0,74±0,13
40% Treino 0,92±0,06 0,95±0,09 0,93±0,04 0,88±0,08 0,77±0,14 0,88±0,09
60% Treino 0,94±0,05 0,99±0,01 0,96±0,03 0,90±0,06 0,89±0,12 0,92±0,07
80% Treino 0,94±0,05 1,00±0,01 0,97±0,03 0,91±0,07 0,98±0,05 0,93±0,06
B 8: Resultados CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de Treino
do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
20% Treino 0,91±0,06 0,89±0,09 0,89±0,07 0,85±0,08 0,88±0,08 0,84±0,09
40% Treino 0,94±0,04 0,93±0,06 0,95±0,04 0,91±0,05 0,92±0,05 0,90±0,07
60% Treino 0,95±0,04 0,95±0,05 0,96±0,03 0,93±0,05 0,93±0,05 0,91±0,06
80% Treino 0,96±0,05 0,94±0,06 0,96±0,04 0,93±0,06 0,93±0,06 0,91±0,07
B 9: Resultados de CDP da Regressão Logística para as diferentes percentagens de Treino do conjunto
𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
20% Treino 0,90±0,04 0,98±0,02 0,92±0,04 0,82±0,07 0,96±0,03 0,83±0,08
40% Treino 0,91±0,04 0,99±0,01 0,93±0,04 0,83±0,07 0,97±0,03 0,87±0,06
60% Treino 0,92±0,04 0,99±0,01 0,93±0,04 0,84±0,08 0,98±0,03 0,88±0,07
80% Treino 0,92±0,06 0,99±0,01 0,93±0,05 0,86±0,10 0,98±0,04 0,89±0,08
B 10: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.
MH PH NH
20% Treino 0,82±0,07 0,8±0,05 0,92±0,05
40% Treino 0,84±0,05 0,8±0,05 0,93±0,04
60% Treino 0,85±0,06 0,81±0,05 0,93±0,04
80% Treino 0,85±0,08 0,81±0,06 0,94±0,05
B 11: Resultados de CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.
MH PH NH
20% Treino 0,82±0,07 0,74±0,07 0,92±0,05
40% Treino 0,83±0,06 0,74±0,06 0,93±0,04
60% Treino 0,84±0,06 0,75±0,07 0,93±0,04
80% Treino 0,84±0,08 0,75±0,08 0,94±0,05
VII
B 12: Resultados de CDP da Regressão Logística para as diferentes percentagens de Treino do
conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.
MH PH NH
20% Treino 0,85±0,06 0,61±0,07 0,92±0,05
40% Treino 0,85±0,05 0,62±0,05 0,93±0,04
60% Treino 0,86±0,06 0,62±0,05 0,94±0,04
80% Treino 0,86±0,08 0,62±0,07 0,94±0,05
B 13: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de
Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
20% Treino 0,80±0,13 0,84±0,15 0,77±0,13 0,72±0,14 0,82±0,15 0,73±0,14
40% Treino 0,93±0,05 0,94±0,09 0,94±0,05 0,88±0,07 0,81±0,15 0,87±0,07
60% Treino 0,94±0,04 0,99±0,01 0,96±0,03 0,90±0,06 0,89±0,12 0,90±0,06
80% Treino 0,95±0,06 1,00±0,01 0,97±0,03 0,91±0,07 0,98±0,05 0,91±0,07
B 14: Resultados de CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de
Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
20% Treino 0,91±0,06 0,88±0,09 0,89±0,08 0,85±0,09 0,87±0,08 0,84±0,10
40% Treino 0,94±0,04 0,94±0,06 0,95±0,03 0,91±0,05 0,91±0,05 0,90±0,07
60% Treino 0,95±0,04 0,95±0,05 0,96±0,03 0,92±0,05 0,92±0,05 0,91±0,06
80% Treino 0,95±0,05 0,95±0,06 0,96±0,04 0,93±0,06 0,92±0,06 0,92±0,07
B 15: Resultados de CDP da Regressão Logística para as diferentes percentagens de Treino do
conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Cor.
ED_Art_Deco ED_Rosa ED_Trovoada ED_Pastel FM_Art_Deco FM_Sunset
20% Treino 0,91±0,04 0,97±0,02 0,92±0,04 0,84±0,07 0,96±0,02 0,80±0,09
40% Treino 0,92±0,04 0,98±0,02 0,93±0,04 0,85±0,06 0,97±0,02 0,83±0,07
60% Treino 0,92±0,05 0,99±0,02 0,93±0,04 0,86±0,07 0,98±0,03 0,84±0,08
80% Treino 0,92±0,06 0,99±0,02 0,94±0,04 0,87±0,10 0,98±0,04 0,86±0,10
B 16: Resultados de CDP do modelo fuzzy com GK clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.
MH PH NH
20% Treino 0,79±0,07 0,78±0,06 0,92±0,05
40% Treino 0,8±0,06 0,8±0,05 0,93±0,04
60% Treino 0,81±0,06 0,8±0,05 0,93±0,04
80% Treino 0,81±0,08 0,8±0,06 0,94±0,05
B 17: Resultados de CDP do modelo fuzzy com FCM clustering para as diferentes percentagens de Treino do conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.
MH PH NH
20% Treino 0,78±0,07 0,72±0,08 0,91±0,05
40% Treino 0,79±0,06 0,73±0,07 0,93±0,04
60% Treino 0,8±0,06 0,74±0,07 0,93±0,04
80% Treino 0,8±0,08 0,73±0,08 0,93±0,05
VIII
B 18: Resultados de CDP da Regressão Logística para as diferentes percentagens de Treino do
conjunto 𝑹𝒂𝒘𝑫𝒂𝒕𝒂𝟓 de descritores para classificação de Textura.
MH PH NH
20% Treino 0,82±0,06 0,57±0,07 0,92±0,06
40% Treino 0,83±0,05 0,56±0,05 0,93±0,04
60% Treino 0,83±0,06 0,56±0,06 0,94±0,04
80% Treino 0,83±0,08 0,56±0,07 0,94±0,05
B.2. Definição do conjunto de descritores
B 19: Resultados de CDP dos modelos de decisão GK, FCM e RL de classificação de cor com 40% de dados de treino para todas os conjuntos de dados globais
𝑅𝑎𝑤𝐷𝑎𝑡𝑎3 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7
GK 0,78±0,14 0,77±0,14 0,81±0,15
FCM 0,90±0,06 0,90±0,07 0,90±0,07
RL 0,83±0,06 0,83±0,07 0,83±0,07
B 20: Resultados de CDP dos modelos de decisão GK, FCM e RL de classificação de textura com 20% de dados de treino para todas os conjuntos de dados globais
𝑅𝑎𝑤𝐷𝑎𝑡𝑎3 𝑅𝑎𝑤𝐷𝑎𝑡𝑎5 𝑅𝑎𝑤𝐷𝑎𝑡𝑎7
GK 0,76±0,08 0,80±0,07 0,78±0,07
FCM 0,67±0,07 0,74±0,07 0,72±0,08
RL 0,63±0,07 0,61±0,07 0,57±0,07
IX
Anexo C - Classificação das amostras de verificação (98 amostras)
C.1. Classificação nas diferentes Classes de Cor
C 1: Resultado de Classificação para ED_Art_Deco sem erros de classificação.
C 2: Resultado de Classificação para ED_Rosa sem erros de classificação.
X
C 3: Resultado de Classificação para ED_Trovoada sem erros de classificação.
C 4: Resultado de Classificação para ED_Pastel sem erros de classificação.
XI
C 5: Resultado de Classificação para FM_Art_Deco sem erros de classificação.
C 6: Resultado de Classificação para FM_Sunset com erros de classificação assinalados.
C.2. Classificação nas diferentes Classes de Textura
C 7: Resultado de Classificação para Muito Homogéneo com erros de classificação assinalados.
XII
C 8: Resultado de Classificação para Pouco Homogéneo com erros de classificação assinalados.
C 9: Resultado de Classificação para Nada Homogéneo com erros de classificação assinalados.
XIII
Anexo D - Paper aceite no RecPad 2015
XIV