Click here to load reader

EXPLORANDO INFERÊNCIA EM UM SISTEMA DE ANOTAÇÃO SEMÂNTICA

  • View
    4.988

  • Download
    0

Embed Size (px)

DESCRIPTION

Dissertação completa em: http://www2.comp.ime.eb.br/dissertacoes/2011-Celso_Fontes.pdf Ferramenta disponível em: http://code.google.com/p/autometa/

Text of EXPLORANDO INFERÊNCIA EM UM SISTEMA DE ANOTAÇÃO SEMÂNTICA

  • 1. Explorando Inferncia em um Sistema de Anotao Semntica Orientadoras: Maria Claudia R. Cavalcanti, D.Sc.Ana Maria de Carvalho Moura, Dr. Ing Aluno: Celso Araujo FontesInstituto Militar de Engenharia Rio de Janeiro, 26 de maio de 2011Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011

2. Sumrio 1. Introduo 2. Fundamentao Terica 3. Anotao Semntica 4. Arquitetura para o desenvolvimento de umsistema de anotao automtica em documentos 5. Desenvolvimento da ferramenta AutMeta 6. Avaliao e Testes 7. ConclusoCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 3. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoIntroduo Pesquisas ainda so baseadas em textos,dificultandoa preciso na recuperao da informaoCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 4. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoIntroduo Metadados Web Semntica RDF, OWL ... Web Tradicional = usa-se somente HTML Onde est a semntica? nome: celso, cidade: rio de janeiro Anotao SemnticaCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 5. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoMotivao Anotar no uma tarefa trivial Grande volume de documentos Necessidade de mecanismos automticos de anotao Ferramentas atuais de anotao semntica Vocabulrios Arbitrrios Ferramentas nem sempre exploram as informaes implcitas Utilizao de formatos prprios dificulta a recuperao por ferramenta de busca semntica.Celso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 6. Introduo Fundamentao Terica Anotao SemnticaArquitetura Avaliao e TestesConclusoReferncias BibliogrficasHiptese possvel gerar documentos melhor anotados a partir da exploraomais profunda da ontologia, contemplando inferncia?Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 7. Introduo Fundamentao Terica Anotao SemnticaArquitetura Avaliao e TestesConclusoReferncias BibliogrficasObjetivos da dissertao Desenvolver um sistema para anotao semntica em documentos com base em conceitos de uma ontologia Utilizar-se de um raciocinador para inferir novas anotaes Uso de meta anotaes para justificar as anotaes inferidas.Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 8. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoFundamentao Terica Ontologia: Uma especificao explcita de uma conceituao. A conceituao uma abstrao simplificada do domnio em que se deseja representar para algum propsito (GRUBBER, 1992) Caractersticas: Classes Relaes InstnciasCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 9. Introduo Fundamentao Terica Anotao SemnticaArquitetura Avaliao e TestesConclusoReferncias BibliogrficasLinguagens para Representao de Ontologias RDF (Resource Description Framework) Exemplo: Maria Claudia orienta Celso#Maria orienta#CelsoClaudiaSujeito Predicado ObjetoCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semnticaMaio/2011 10. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoLinguagens para Representao de Ontologias OWL (Web Ontology Language):Um exemplo com inferncia com sinonmiaCelso orienta (inferido) MariaClaudiaYokoCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 11. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoAnotao Semntica A anotao semntica de um documento descreve o seu contedo pela associao de trechos relevantes do texto e conceitos descritos em uma ontologia (ELLER, 2008).Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 12. Anotao Semntica Adaptado de (OREN, 2006)Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 13. Introduo Fundamentao Terica Anotao SemnticaArquitetura Avaliao e TestesConclusoReferncias BibliogrficasAnotao Semntica Para OREN et al. (2006), o resultado de uma anotao A uma tupla , onde: as o dado (ou sujeito) sendo anotado ao a anotao em si ap o predicado que define o tipo de relacionamento entre o as e ao ac o contexto em que a anotao feita.Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 14. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoEspecificaes para Anotao Semntica Microformat eRDF RDFa HTML5 MicrodataCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 15. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoHTML

Celso Araujo, nascido em 25/11/1985.

Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 16. Introduo Fundamentao Terica Anotao SemnticaArquitetura Avaliao e TestesConclusoReferncias BibliogrficasHTML+RDFa

Celso Araujo, nascido em 25/11/1985

Celso Araujo #Celso25/11/1985Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 17. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoFerramentas de Anotao Semntica GATE SMORE Annotea Amaya OpenCalais Zemanta Ontos TextwizeCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 18. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoFerramentas de Anotao Semntica IIi iii Iv v ViVii Armazenamento da Referncia com a Referncia entre Entrada de Ontologias Representao da AnotaoTipoPlataforma AnotaoOntologiatermo e AnotaoCustomizadas AnnoteaNo intrusiva RDF/XML XpointerSIM SIM ManualDesktop GATEHbrida Banco de dados e XMLURIS SIM SIM Hbrida Desktop KIMNo intrusiva?????? SIM SIMAutomtica Desktop RDF/XML, JSON, OpenCalais No intrusiva Microformat eURIS SIM NOAutomtica WebSimpleFormatXML, JSON, WNJSON, ZemantaNo intrusiva URL NO NOAutomtica WebRDF/XML SMORENo intrusiva RDF/XMLURIS NO SIM ManualDesktop OntosNo intrusiva JSON??? ??? SIMAutomtica Web TextWise No intrusivaJSON, XML e RDFURI SIM NOAutomtica WebCelso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 19. Introduo Fundamentao Terica Anotao SemnticaArquitetura Avaliao e TestesConclusoReferncias BibliogrficasFerramentas de Anlise e Busca Semntica Sindice Google Rich Snippets Yahoo Search MonkeyCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 20. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoUso de Anotao SemnticaCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 21. IntroduoFundamentao TericaAnotao Semntica ArquiteturaAvaliao e Testes Concluso Referncias BibliogrficasUso de Anotao Semnticafonte: http://oreilly.com/catalog/9780596153823/asProgramming the Semantic WebapaoCelso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 22. Introduo Fundamentao Terica Anotao SemnticaArquitetura Avaliao e TestesConclusoReferncias BibliogrficasFerramentas de Anlise e Busca SemnticaCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 23. IntroduoFundamentao TericaAnotao Semntica ArquiteturaAvaliao e Testes Concluso Referncias BibliogrficasArquitetura para anotao Semntica Automtica em DocumentosAnalisador RaciocinadorDocumentoUsurioOntologiaAnotador AnotadoAnlise e ComparaoMetaAnotao MetaDocumento AnotadorAgenteNo EstruturadoCelso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 24. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoProcesso de Anotao (Entrada)owl:sameAs #Maria_Claudia#YokoconheceOntologia #Celso conhece#Ana_MariaCelso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 25. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoProcesso de Anotao (Identificao dos Termos) Celso aluno das Professoras Yoko e Ana Maria.Analise e owl:sameAs Comparao#Maria_Claudia#Yokoconhece#Celso conhece#Ana_MariaCelso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 26. IntroduoFundamentao TericaAnotao Semntica ArquiteturaAvaliao e Testes Concluso Referncias BibliogrficasProcesso de Anotao (Identificao das Triplas) Celso aluno das Professoras Yoko e Ana Maria. 1. Celso conhece Maria_Claudia 2. Celso conhece Ana_Maria 3. Celso conhece Yoko AnalisadorRaciocinador owl:sameAs#Maria_Claudia #Yoko conhece#Celso conhece#Ana_MariaCelso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 27. Introduo Fundamentao Terica Anotao SemnticaArquitetura Avaliao e TestesConclusoReferncias BibliogrficasProcesso de Anotao (Meta anotao sob a inferncia) 3. Celso conhece YokoAnotao referenciaId 3_ resultadoDe:Celso conhece Maria_ClaudiaMaria_Claudia mesmaPessoaQue Yokoowl:sameAs #Maria_Claudia #Yokoconhece #Celso conhece Raciocinador #Ana_Maria ExplainerCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 28. IntroduoFundamentao TericaAnotao Semntica ArquiteturaAvaliao e Testes Concluso Referncias BibliogrficasMeta-AnotaoBaseado em OWL (MCGUINNESS e HARMELEN, 2004) e OWL2 (MOTIK, et al., 2009)Celso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 29. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoMeta-Anotao Toda Pessoa tem 2 progenitores Neymar filho de Nadine e Neymar Santos Sua me e seu pai no so as mesmas pessoas Seu pai tambm conhecido como Neymar Pai Declaraes (metaanotaao) Anotao InferidaCelso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 30. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoDesenvolvimento da ferramenta AutMeta (AutoMatic MetaData) Tecnologias adotadas para prototipao: JAVA NetBeans OWLAPI Pellet Java-rdfa Jakarta-CommonsCelso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 31. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoFormalismo de Anotao do AutMeta .. Termo > TermoCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 32. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoExemplo de Anotao gerada pelo Autmeta prion protein What is the role of PrnP im mad cow disease?Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 53. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoPreciso (Sinonimia)Trecho de documento NAO RELEVANTE Cathepsin DHow do Cathepsin D (CTSD) and apolipoprotein E (ApoE) interactions contribute to Alzheimersdisease?Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 54. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoCobertura (TXT X REASONER)001001001001 001 001 000 000000000000160 161 162163 164165 166167 168169 170171 172174 176177 178 179 181 182 184txt (recall) reasoner (recall)185 186 187Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 55. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoMedida F (TXT x REASONER)001001001 001 000 000 000000000160 161 162 163 164 165 166 167 168 169 170 171 172 174 176 177 178 179 181 182 184 txt (medida f) reasoner (medida f) 185 186 187Celso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 56. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoSegundo Ambiente Simulao de uma ferramenta de busca semntica Base com inferncia X Base sem inferncia Consultas em SPARQL Jena JavaRDFaCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 57. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoSPARQL Anotao das perguntas pelo AutMeta para recuperao dos termos da ontologia Tripla Chave: Sujeito annimo (?asn) Predicado (ap) e objeto (ao) nicosSELECT ?g WHEREGRAPH ?g{?as1 foaf:page .?as2 foaf:page }Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 58. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoPreciso (REASONER x NOREASONER) 001 001001001001000 000 000 000 000 160 161 162163 164 165166 167 168 169 170 171 172 174 176 177 178 179 181 182 no reasoner (precision) reasoner (precision)184 185 186 187Celso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semntica Maio/2011 59. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoPreciso (REASONER x NOREASONER) Resultados baixos em sua maioria para ambas as bases Maior sucesso na mdia final para baseReasoner (0,22 x 0,09) Casos de Derrotas de Reasoner por: Maior nmero de documentos retornados Maior nmero de triplas retornados pelas consultas SPARQLsCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 60. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoCobertura (REASONER X NOREASONER)001 001 001 001 001001000000000000 000 160 161 162163 164 165 166167 168169 170171 172174 176177 178 no reasoner (recall)reasoner (recall)179181 182 184 185 186 187Celso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semnticaMaio/2011 61. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoCobertura Melhores resultados da baseReasoner (0,89 x 0,29) Maior nmero de documentos retornados graas a sinonmia e ao SPARQLCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 62. Introduo Fundamentao Terica Anotao SemnticaArquiteturaDesenvolvimento da Ferramenta Avaliao e TestesConclusoMedida F (REASONER x NOREASONER) 001 001 001 001000000000000 000 160 161 162163 164 165 166 167 168169 170171 172174 176177 178179 181182 184185 186no reasoner (medida f) reasoner (medida f)187Celso Araujo Fontes (IME)Explorando inferncia em um sistema de anotao semnticaMaio/2011 63. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoMedida FAmbiente Tradicional Ambiente Semntico0,22 0,21 0,080,29Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 64. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoConcluso Este trabalho teve como objetivo desenvolver um sistema que permitisse o enriquecimento de documentos atravs de anotaes semnticas explorando o potencial implcito de uma ontologia.Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 65. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoContribuies Estudo comparativo de Ferramentas e Padres de anotao semntica; Proposta de uma arquitetura para anotao semntica; Taxonomia para especificao de Meta Anotaes; Recorte ontolgico da base de dados Dbpedia; Metodologia para a traduo de perguntas para SPARQL;Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 66. Contribuies Utilizao de uma abordagem de anotao semntica em formato aberto e visvel pelos principais mecanismos de busca semntica do mercado (ex.: Sindice e Google); Dois ambientes de recuperao (tradicional e semntico); Artigo exposto no ONTOBRAS 2010 (FONTES, et al., 2010c) Artigo apresentado no WTDBD 2010 (FONTES, et al., 2010b) Artigo submetido para o SBBD 2011Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 67. IntroduoFundamentao TericaAnotao Semntica Arquitetura Desenvolvimento da FerramentaAvaliao e Testes ConclusoTrabalhos Futuros Uso de tcnicas avanadas de lingustica computacional Anotaes feitas pela ferramenta de modo a auxiliar na seleo dos melhores termos, onde a ferramenta poderia fazer sugestes ao especialista; Mltiplas ontologias Otimizao no recurso de auto completar Formatos ricos de documento de entradaCelso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011 68. Referncias Bibliogrficas OREN, E. What are Semantic Annotations?. 2006. Disponvel em: . BECHARA, A. Expanso semntica de consultas baseada em esquemas terminolgicos: uma experimentao no domnio biomdico. 2010. Disponvel em: . Dissertao de Mestrado, UFRJ. GRUBER, T. A Translation Approach to Portable Ontology Specifications. 1992. Disponvel em: . BARROS, F. Avaliao de Desempenho de Sistemas de RI. 2011. Disponvel em: MCGUINESS D. e F. HARMELEN. OWL Web Ontology Language Overview. Disponvel em: . MOTIK, B., P. PATEL-SCHNEIDER e B. PARSIA. 2009. OWL 2 Web Ontology Language Structural Specification and Functional-Style Syntax. Disponvel em: .Celso Araujo Fontes (IME) Explorando inferncia em um sistema de anotao semntica Maio/2011