Text Mining Sistemas de Informação e Gestão. Introdução Text Mining, geralmente é definido...

Preview:

Citation preview

Text MiningText MiningSistemas de Informação e Gestão

IntroduçãoIntrodução

Text Mining, geralmente é definido como um processo que utiliza métodos para navegar, organizar, encontrar e descobrir informação escrita na linguagem natural.

É possível manipular mais facilmente as informações não estruturadas como notícias, textos em websites, blogs etc.

Extracção de InformaçãoExtracção de Informação

Exemplo:◦José da Silva é funcionário da Empresa XYZ,

mora na Rua X, número 31, tem 35 anos de idade, e ...

Resultado:◦Nome: José da Silva◦Empresa: XYZ◦Endereço: Rua X, 31◦Idade: 35 anos

Text MiningText Mining

O processo de mineração de textos foi definido por Martins Junior (2003) em função das seguintes actividades:

1. Obtenção dos Documentos2. Pré-Processamento dos Documentos3. Extracção do Conhecimento ou Classificação4. Avaliação do Conhecimento

Obtenção dos DocumentosObtenção dos Documentos

Selecção dos documentos textuais a serem utilizados no processo de mineração.◦Texto Puro◦HTML◦XML◦etc.

Pré-ProcessamentoPré-Processamento

Consiste em Determinar uma forma padrão para a extracção do conhecimento / Classificação no documento condido

Extracção do ConhecimentoExtracção do Conhecimento

Operações realizadas com o intuito de capturar informações / classificar dados num conjunto de entrada não estruturado.

É a etapa de “mineração” propriamente dita.

Avaliação do ConhecimentoAvaliação do Conhecimento

Determina se o conhecimento é válido (se está coreto, e se é útil).

Recommended