Dicionário Aberto

Embed Size (px)

DESCRIPTION

Apresentado na Associação Portuguesa de Linguística, 21 de Novembro.

Text of Dicionário Aberto

  • 1.Dicionrio Aberto a Alberto Simes e Rita Farinha o21 Novembro 2008 Alberto Simes e Rita FarinhaoDicionrio Aberto a

2. Motivao ca No existem dicionrios (convencionais) disponaa veis: existem dicionrios consultveis (Infopedia, Priberam...) aa no existem dicionrios descarregveisa aa Impossibilita processamento automtico!aA construo de um dicionrio dispendiosa:caa e necessita de muita mo de obra (especializada); a demorada (mais de 5 anos para qualidade m enima).Tentar aproveitar trabalho (bem) feito: editoras no fornecem dicionrios (fazem elas bem!); a a mas existem dicionrios no dom pblico!anio uAlberto Simes e Rita FarinhaoDicionrio Aberto a 3. Domnio Publico Legislao sobre obras literrias:ca aAs obras tm um pereodo de Direitos de Autor;Este perodo limitado: os Direitos de Autor expiram! eDe acordo com a legislao portuguesa:caum livro entra no Dom Pblico: nio u 70 anos aps a morte do autor; o 70 anos aps o ano de edio da obra; oca Varia de pa para pas s! Alberto Simes e Rita FarinhaoDicionrio Aberto a 4. Dicionrio no Domnio Publico a Encontrando um Dicionrio no Dom Pblico:anio u Torna-se legal a sua utilizao integral. caMas um dicionrio no Dom Pblico:anio u Ter sido publicado pelo menos antes de 1938;a O seu autor ter de ter falecido antes de 1938;aAlm disso, necessrio: e e a Ter acesso ` obra;a Denir mtodos de digitalizao da obra;eca Alberto Simes e Rita FarinhaoDicionrio Aberto a 5. Dicionrio Escolhido a Novo Diccionrio da Lngua aPortuguesa Candido de Figueiredo 1913 Alberto Simes e Rita FarinhaoDicionrio Aberto a 6. Porqu esta escolha?e O Dicionrio tem alguma fama; a Sabemos que fcil atribuir-lhe defeitos! e aRazoavelmente completo:dicionrio em dois volumes;amais de mil pginas por volume; asegunda(?) edio; caDispon na Biblioteca Nacional; velcom projecto de digitalizao agendado pela BND;cano Dom Pblico! (1913!) nio u Alberto Simes e Rita FarinhaoDicionrio Aberto a 7. Porqu esta escolha?e O Dicionrio tem alguma fama; a Sabemos que fcil atribuir-lhe defeitos! e aRazoavelmente completo:dicionrio em dois volumes;amais de mil pginas por volume; asegunda(?) edio; caDispon na Biblioteca Nacional; velcom projecto de digitalizao agendado pela BND;cano Dom Pblico! (1913!) nio u Alberto Simes e Rita FarinhaoDicionrio Aberto a 8. Porqu esta escolha?e O Dicionrio tem alguma fama; a Sabemos que fcil atribuir-lhe defeitos! e aRazoavelmente completo:dicionrio em dois volumes;amais de mil pginas por volume; asegunda(?) edio; caDispon na Biblioteca Nacional; velcom projecto de digitalizao agendado pela BND;cano Dom Pblico! (1913!) nio u Alberto Simes e Rita FarinhaoDicionrio Aberto a 9. Necessidade de Digitalizao/TranscriocacaO Dicionrio torna-se util depois de digitalizado: a embora j seja interessante ter acesso ` imagem, aa imprescind ter acesso ao texto! e vel No poss realizar OCR com qualidade:a evel quando o documento tem fraca qualidade de impresso;a o tamanho da letra usado pequeno; e estamos a falar de portugus antigo!! e Uma transcrio completamente manual: ca demasiado demorada; e pouco motivadora; e O processo de transcrio usado baseia-se: ca na experincia do Projecto Gutenberg;e na ferramenta Web Distributed Proofreaders;Alberto Simes e Rita FarinhaoDicionrio Aberto a 10. Necessidade de Digitalizao/TranscriocacaO Dicionrio torna-se util depois de digitalizado: a embora j seja interessante ter acesso ` imagem, aa imprescind ter acesso ao texto! e vel No poss realizar OCR com qualidade:a evel quando o documento tem fraca qualidade de impresso;a o tamanho da letra usado pequeno; e estamos a falar de portugus antigo!! e Uma transcrio completamente manual: ca demasiado demorada; e pouco motivadora; e O processo de transcrio usado baseia-se: ca na experincia do Projecto Gutenberg;e na ferramenta Web Distributed Proofreaders;Alberto Simes e Rita FarinhaoDicionrio Aberto a 11. Necessidade de Digitalizao/TranscriocacaO Dicionrio torna-se util depois de digitalizado: a embora j seja interessante ter acesso ` imagem, aa imprescind ter acesso ao texto! e vel No poss realizar OCR com qualidade:a evel quando o documento tem fraca qualidade de impresso;a o tamanho da letra usado pequeno; e estamos a falar de portugus antigo!! e Uma transcrio completamente manual: ca demasiado demorada; e pouco motivadora; e O processo de transcrio usado baseia-se: ca na experincia do Projecto Gutenberg;e na ferramenta Web Distributed Proofreaders;Alberto Simes e Rita FarinhaoDicionrio Aberto a 12. Necessidade de Digitalizao/TranscriocacaO Dicionrio torna-se util depois de digitalizado: a embora j seja interessante ter acesso ` imagem, aa imprescind ter acesso ao texto! e vel No poss realizar OCR com qualidade:a evel quando o documento tem fraca qualidade de impresso;a o tamanho da letra usado pequeno; e estamos a falar de portugus antigo!! e Uma transcrio completamente manual: ca demasiado demorada; e pouco motivadora; e O processo de transcrio usado baseia-se: ca na experincia do Projecto Gutenberg;e na ferramenta Web Distributed Proofreaders;Alberto Simes e Rita FarinhaoDicionrio Aberto a 13. Projecto GutenbergUm arquivo de obras literrias; a E de outras no to literrias (tcnicas); a aa e E ainda partituras...http://www.gutenberg.org/Em formato textual e/ou udio;a Livres de direitos de autor (no pa em que fois transcrito...) Em diferentes lnguas (incluindo transcries). co Portugus com mais de 300 livros...e Alberto Simes e Rita FarinhaoDicionrio Aberto a 14. Projecto GutenbergUm arquivo de obras literrias; a E de outras no to literrias (tcnicas); a aa e E ainda partituras...http://www.gutenberg.org/Em formato textual e/ou udio;a Livres de direitos de autor (no pa em que fois transcrito...) Em diferentes lnguas (incluindo transcries). co Portugus com mais de 300 livros...e Alberto Simes e Rita FarinhaoDicionrio Aberto a 15. Distributed ProofreadersUma ferramenta web para ajuda na transcrio de obras:ca permite a criao de projectos de transcrio; caca de qualquer obra (depois de pedida a devida autorizao); ca http://www.pgdp.net/ Cada obra : e dividida por pginas; a transcrita pgina a pgina; a a cada utilizador recebe a prxima pgina por transcrever.oaComunidade Portuguesa:http://pagina-a-pagina.blogspot.com/Alberto Simes e Rita FarinhaoDicionrio Aberto a 16. Distributed ProofreadersUma ferramenta web para ajuda na transcrio de obras:ca permite a criao de projectos de transcrio; caca de qualquer obra (depois de pedida a devida autorizao); ca http://www.pgdp.net/ Cada obra : e dividida por pginas; a transcrita pgina a pgina; a a cada utilizador recebe a prxima pgina por transcrever.oaComunidade Portuguesa:http://pagina-a-pagina.blogspot.com/Alberto Simes e Rita FarinhaoDicionrio Aberto a 17. Distributed ProofreadersUma ferramenta web para ajuda na transcrio de obras:ca permite a criao de projectos de transcrio; caca de qualquer obra (depois de pedida a devida autorizao); ca http://www.pgdp.net/ Cada obra : e dividida por pginas; a transcrita pgina a pgina; a a cada utilizador recebe a prxima pgina por transcrever.oaComunidade Portuguesa:http://pagina-a-pagina.blogspot.com/Alberto Simes e Rita FarinhaoDicionrio Aberto a 18. Transcrio: Digitalizao ca ca Alberto Simes e Rita FarinhaoDicionrio Aberto a 19. Transcrio: OCR ca de um org~o, para fora do lugar normal: pjrolapso a do tero. (Lat. lapsus).u*Prolator,m. Jur. Aquelle que promulga (uma lei). (Lat. prolator).Prole,f. Prognie; gera~o. Filho ou filhos.e ca Success~o. (Lat. proles).aProlegdmenos,f. pi. Introduc~o geral de uma ca obra sci^ntifica ou artstica. Prefcio longo. Exposiao e a c~ preliminar dos princpios geraes de uma sci^ncia ou arte. (Gr. prolegomena).eProlepse,f. Figura de Rhetrica, que consiste o em prevenir objecoes, fazendo-as a si prprio ec~o destrundo-as. (Lat. prolepsis). *Prolepticamente,adv. De modo prolptico. e* Prolptico,adj. Relativo a prolepse. Med.e Diz-se da febre, cujos accessos se antecipam, quanto hora, em que normalmente appareceriani.a (Gr. proleptikos).Alberto Simes e Rita Farinha oDicionrio Abertoa 20. Transcrio nal ca de um org~o, para fora do lugar normal: a _prolapso do utero_. (Lat. _lapsus_).* *Prolator*, _m. Jur._ Aquelle que promulga (uma lei). (Lat. _prolator_).*Prole*, _f._ Prog^nie; gera~o. e ca Filho _ou_ filhos. Success~o.a (Lat. _proles_).*Prolegmenos*,o _f. pl._ Introduc~o geral de uma obra sci^ntifica _ou_ artstica.cae Prefcio longo. a Exposi~o preliminar dos princpios geraes de uma sci^ncia _ou_ arte. cae (Gr. _prolegomena_).*Prolepse*, _f._ Alberto Simes e Rita FarinhaoDicionrio Aberto a 21. Tratamento Informticoa1 As pginas so agrupadas por blocos a a; 2 Os blocos so adicionados ` letra respectiva diariamente;aa 3 Cada letra processada e inserida numa base de dados:e Passando por um sistema de testes automtico:a Validando a sintaxe; Vericando a consistncia do dicionrio!e a 4 So gerados:a Verso atextual do dicionrio; a Verso aconsultvel via Web; a Verso aem PDF para impresso (mais de 1100 pginas...) a a Verso apara consulta em StarDict;Alberto Simes e Rita FarinhaoDicionrio Aberto a 22. Consulta WebAlberto Simes e Rita Farinha oDicionrio Abertoa 23. Consulta Web (em contexto)Alberto Simes e Rita Farinha oDicionrio Abertoa 24. PDF para impresso aAlberto Simes e Rita Farinha oDicionrio Abertoa 25. Consulta Local (StarDict) Alberto Simes e Rita FarinhaoDicionrio Aberto a 26. Mas para qu?eO dicionrio no demasiado antigo? a a e Serve para estudos lingu sticos; Ser modernizado automaticamente;a com regras automticas,a usando correctores ortogrcos.a ir conter erros!! a No existem j muitos dicionrios dispona aa veis? Sim, mas este estar completamente aberto.a poss o utilizador descarregar todo o dicionrio em Evela formato textual; Vai ser poss o utilizador contribuir adicionando vel actualizando entradas, corrigindo erro