112
Editora da Universidade do Vale do Rio dos Sinos Editora Unisinos Av. Unisinos, 950 93022-000 São Leopoldo-RS-Brasil [email protected] www.edunisinos.com.br

Editora da Universidade do Vale do Rio dos Sinos Editora ... · e cenários comunicativos mediados pelo texto ... de relatos de parto após cesárea de mulheres brasileiras e

  • Upload
    lehanh

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

EditoradaUniversidadedoValedoRiodosSinosEditoraUnisinosAv.Unisinos,950

93022-000Sã[email protected]

www.edunisinos.com.br

2

Caderno de Resumos ELC-EBRALC 2017 corresponde à 1ª edição em versãoeletrônica. O Caderno de Resumos ELC-EBRALC 2017 é uma publicação em queestão compilados os resumos dos trabalhos (português e inglês) submetidos paraapresentaçãona IXEscolaBrasileiradeLinguísticaComputacional (EBRALC2017)enoXIVEncontrodeLinguísticadeCorpus(ELC2017).Osresumosestãoorganizadospormodalidadedeapresentação.

ISBN:978-85-98396-11-8©SãoLeopoldo:Unisinos,2017.

OrganizaçãoAlineEversAlineNardesLarissaBrangel

MariaJoséBocornyFinattoRoveLuizadeOliveiraChishman

AgradecimentoespecialPPG-LetrasUFRGS

UniversidadeFederaldoRioGrandedoSulPPGLA-UNISINOS

UniversidadedoValedoRiodosSinos

EditoradaUniversidadedoValedoRiodosSinosEditoraUnisinosAv.Unisinos,950

93022-000Sã[email protected]

www.edunisinos.com.br

3

APRESENTAÇÃO Nesta publicação, você encontra os resumos dosworkshops, minicursos e

minicursosexpressos,dasmesasredondasedostrabalhosapresentadosnassessõesOral,PôstereMinutodeLoucuraquefazempartedoELC-EBRALC2017.

OXIV Encontro de Linguística de Corpus (ELC) e a IX Escola Brasileira deLinguísticaComputacional(EBRALC),doiseventosassociados,ocorrementreosdias15 e 18 de agosto de 2017 em São Leopoldo-RS, na UNISINOS. Em ediçõesanteriores, participantes discutiram temas comoConvergência tecnológica para oprocessamentoeanálisedas línguas(2012),Corpus, tecnologiaecultura(2014)eContribuições da Linguística de Corpus para a pesquisa Linguística e para osEstudos da Tradução (2015). Em 2017, a temática envolve reflexões sobre asContribuiçõesdaLinguísticadeCorpusparaosEstudossobreGênerosTextuaiseDiscursivos.

OELC-EBRALC2017éumainiciativaconjuntadoProgramadePós-GraduaçãoemLinguísticaAplicada(PGLA)daUniversidadedoValedoRiodosSinos(Unisinos)edoProgramadePós-GraduaçãoemLetras(PPGLet)daUniversidadeFederaldoRioGrande do Sul (UFRGS). Participam da organização do evento pesquisadores daUniversidadeFederaldeCiênciasdaSaúdedePortoAlegre (UFCSPA),daPontifíciaUniversidadeCatólicadoRioGrandedoSul(PUCRS)edaUniversidadedeCaxiasdoSul(UCS).

Neste Caderno de Resumos, estão relatos de pesquisas em Linguística deCorpus e LinguísticaComputacional relacionados à LinguísticaHistórica, LinguísticaAplicada,aoEnsinodeLínguasedeTradução,àLinguísticaCognitiva,àsCiênciasdaInformação,dentreoutras.NelevocêencontrareflexõessobreascontribuiçõesdaLinguísticadeCorpusparaosEstudossobreGênerosTextuaiseDiscursivosapartirdeanálisesrealizadascomapoiodatecnologia.Essestrabalhosbuscamdemonstrarevalidarfatosesuposiçõessobreofuncionamentodalínguaemdiferentesregistrosecenárioscomunicativosmediadospelotexto,principalmenteotextoescrito,mastambémcomabordagenssobrecorporadefala.

*A revisão dos textos dos resumos esteve a cargo dos próprios autores. **O número acima do título do trabalho corresponde ao número de inscrição do mesmo.

4

SUMÁRIO RESUMOSDOSMINICURSOS,MINICURSOSEXPRESSOSEWORKSHOPSESPECIAIS11

“Esquenta”ELC–GrandestemasediálogoscomLinguísticadeCorpus–Integratingcorpusandcognitivelinguisticapproachesinlanguageresearchandteaching:Rationalesandpraxes 12Palestrante:Dr.DilinLIU(DepartmentofEnglish,TheUniversityofAlabama) 12

MinicursoA-IntroduçãoaoPLN/AnálisedeSentimentos 12Ministrante:Prof.Dr.ThiagoPardo(NILC/ICMC/USP) 12

MinicursoB-IntroduçãoàLinguísticadeCorpus:começandodobásico 13Ministrante:Prof.Dra.RozaneR.Rebechi(IL/UFRGS) 13

MinicursoC-ComousaroSketchEngineparaanalisarocomportamentodaspalavras 13Ministrante:Prof.Dra.AnaFrankenberg-Garcia(UniversityofSurrey-UK) 13

MinicursoExpressoI-ASemânticaencontraaLexicografia-dicionáriosbaseadosemframes 14Ministrantes:SemanTec(Unisinos) 14

MinicursoExpressoII-Estudoscontrastivosemespanhol/portuguêseLinguísticadeCorpus 14Ministrante:Prof.Dr.ArielNovodvorski(ILEEL/PPGEL/UFU) 14

WorkshopEspecialI-Estudoscontrastivosemespanhol/portuguêseLinguísticadeCorpus 15Ministrante:Prof.Dr.GuilhermeFrommeProf.Dr.ArielNovodvorski(ILEEL/PPGEL/UFU) 15

WorkshopEspecialII-Avaliaçãoesimplificação-ferramentasepesquisascomcorporaparaoensinoereescritadetextos 15Ministrantes:Prof.MA.AlineEverseProf.MA.BiancaPasqualini(UFRGS) 15

WorkshopCONVIDADO-Usingcorporaforlanguagelearningandteaching 16Ministrante:Dr.DilinLIU(DepartmentofEnglish,TheUniversityofAlabama) 16

PalestradeencerramentodoELC2017-Integratingcorpusandcognitivelinguisticapproachesinlanguageresearchandteaching:Rationalesandpraxes 16Palestrante:Dr.DilinLIU(DepartmentofEnglish,TheUniversityofAlabama) 16

RESUMOSDEAPRESENTAÇÕESORAIS 17

TowardsMachineTranslationfromBrazilianPortuguese-to-Libras:ACorpus-Based,MorphosyntacticAnalysis 18FranciscoAulísiodosSantosPaiva,PlínioAlmeidaBarbosa,PabloFariaeJoséMarioDeMartino 18

Themakingofabilingualdictionary 18AnaFrankenberg-Garcia 18

Representaçõessociaispan-americanas:umestudobaseadoemtrigramasdogooglebooks 18TonyBerberSardinha,MariaClaudiaDelfino,RafaelAraujo 18

5

IdentificaçãodeTermosnoDiscursoLiteráriodeFantasiadaSérieHarryPotteremumaAbordagemDirecionadaporCorpus 19RaphaelMarcoOliveiraCarneiro 19

Clusteringandhierarchicalorganizationofopinionaspects:acorpusstudy 20FrancielleAlvesVargaseThiagoAlexandreSalgueiroPardo 20

Revistabrasileiradelinguísticaaplicada:multidimensõestemáticas 20MariaAntonietaCelani,TonyBerberSardinha,MariaClaudiaDelfino,MarianneRampaso,RafaelAraujoeUlyssesDiegues 20

Addinginformationinargumentativetexts:alearnercorpus-basedstudyofadditivelinkingadverbials 21JessicaMariadaSilvaQueiroz,JessicaCeritelloAlveseDeisePrinaDutra 21

Estudosdecorporanatraduçãoeteoriasdohabitusnaeducação:umolharsobreosbrasileirismosdedarcyribeiroemlínguainglesa 21TalitaSerpaeDivaCardosodeCamargo 21

Reportingonthedevelopmentofsketchgrammarforacademicportuguese 23TanaraZinganoKuhneIztokKosem 23

Pommerschekorpora:umconjuntodecorporadialetaisdavariedadebrasileiradopomerano 25NeubianaSilvaVelosoBeilke 25

AescritadePauloCoelho:dovocabulárioàcomplexidadetextual 28ViníciusAlcesMachado 28

ColocaçõesespecializadasnaáreadoDireitoComercialInternacionalepropostadeglossáriotrilíngue 29JeanMichelPimentelRochaeAdrianeOrenha-Ottaiano 29

Framesdecompreensãoecorpora:estudodecasocomusodaferramentaSketchEngine 29AlineNardesdosSantoseRoveChishman 29

Oqueasresenhasdeviajantespodemnosdizersobreacultura?ALinguísticadeCorpusajudaaresponder 30SandraNavarro 30

Elaboraçãodeumcorpusdecomunicaçõespiloto-controladoremlínguainglesa–questõesteóricasemetodológicas 31PatriciaLucks 31

Compilandocorpusparaapoioàtradução:traduzindo“TraducciónyTraductología–IntroducciónalaTraductología” 33MarinaWaquil 33

ReadBD!(THBSimples!) 35HeloísaOrsiKochDelgado,DéboraMontenegroPasineCarmenVernetti 35

LeituradeartigoscientíficosanglófonosnaEducaçãoProfissional:corpora,léxicoespecializadoeensino 36AndreaJessicaMonzón 36

LCeanálisedodiscursocomenfoquenoestilodotextoliteráriotraduzido:itenslexicaisestrangeirosemThingsFallApart 36CristinaLazzerini 36

6

“Euquerocesárea”ou“Justcutitout!”:AnáliseCríticadoDiscursoderelatosdepartoapóscesáreademulheresbrasileiraseestadunidensesàluzdaLinguísticadeCorpus 37LucianaCarvalhoFonseca 37

AcorpuslinguisticsstudyonBrazilianstudents’academicvocabularyprofilevocabularyprofile 38LarissaGoulartdaSilvaeAnaPaulaSeixasVial 38

Ferramentadeauxílioàproduçãoderedaçõesescolaresemlínguaportuguesa:passosparaaclassificaçãodegrupostextuais 39AlineEverseMariaJoséBocornyFinatto 39

Proficiênciaescritaemlínguainglesaparaaproduçãodeabstractsemciênciasdasaúde:umestudodecorpus 39AnaLuizaPiresdeFreitaseMariaJoséBocornyFinatto 39

UmaabordagemparaidentificaçãodeperiódicosespecializadosnocampodasHumanidadesDigitais 40FranciscoL.daCunhaeGyzelyS.Lima 40

Dicionárioolímpico:desafioseestratégiasparaousodecorporanaconstruçãodeumdicionáriotemático 40RoveChishmaneDiegoSpaderdeSouza 40

Estudodecasobaseadoemcorpussobreoperfilestilísticodeumtradutorliterário 42CarolinaBarcellos 42

RESUMOSPARAPÔSTER 45

RearrangementandCreationofNewCorporaforUpdateandCompressiveSummarizationTasksforPortugueseLanguage 46FernandoAntônioAsevedoNóbregaeThiagoAlexandreSalgueiroPardo 46

ParaaSegmentaçãoAutomáticadeFronteiranaFalaEspontâneaapartirdeParâmetrosProsódicos 46BárbaraFalcão,PlínioA.BarbosaeTommasoRaso 46

Theuseofcorpuslinguisticsinteachingenglishforacademicpurposes 46FabianaKlein 46

Osverbosdodiscursoacadêmicoescritoemumcorpusdeaprendizesdeinglês 48AnnallenadeSouzaGuedes 48

AnotíciapolicialnamiradaLinguísticadeCorpus 49JoacyrOliveira 49

GramáticaLivredeContextoLexicalizadaeaLinguagemRadiológica 50CinthyanRenataSachsC.deBarbosa,DavidsonCuryeEdioRobertoManfio 50

OvocabuláriodePrideandPrejudiceesuatraduçãoparaoportuguês:umaanáliselexicoestatística 51LaísCallegaroFritzeneLuísaBranchiAraújo 51

TICAL:umchatbotqueversasobreassuntoslinguísticos 51FábioCarlosMoreno,EdioRobertoManfioeCinthyanR.SachsC.deBarbosa 51

Vocabuláriosmonolínguesdetermosdateologia:estudoconduzidoporcorpus 51SolangeCardoso 51

7

Terminografiadidático-pedagógica:metodologiaparaapoioàleituraeminglêsdetextosdeeletrotécnica/engenhariaelétrica 54SabrinaBonquevesFadanelli 54

Construçõesdetópiconoportuguêsfaladoemáreasindígenas- 55WliannaSilvadeAraújoeEdivaldaAlvesAraújo 55

OobjetodiretoemconstruçõesdetópicodoséculoXIX 56CristovãoMascarenhasCordeiroeEdivaldaAlvesAraújo 56

BrWac:umgrandecorpusparagrandesdesAFIos 58JorgeAlbertoWagnerFilho,RodrigoWilkenseAlineVillavicencio 58

PlurisignificaçãoemTransitividade 58RodrigoEstevesdeLimaLopes 58

Propostadeumcorpusdoportuguêspopularbrasileirosimplesapartirdoperfilsociodemográficodosleitores 58BiancaFrancoPasqualini 58

Ousodecorporaonlinemultimodaisparaencontraraequivalênciadetermoseminglêstendocomobaseodicionárioolímpico 60CarolineCougo 60

Umestudosobreosparticípioscombaseemcorpus 61LuizaTrugoeCláudiaFreitas 61

ModelagemdeconstruçõesdeestruturaargumentalnoconstructiondaframenetBrasil:desdobramentosparaoprocessamentodelínguanatural 63VâniadeAlmeidaeTiagoTorrent 63

Aosprofessores,ascolocações 65AndréaGeroldodosSantos 65

IntroducingBrAWE:anewresourceforresearchersofEAP 68LarissaGoulartdaSilva,MarineLaisaMatteeSimoneSarmento 68

Inventividadelexicalnosnomesdeoperaçõespoliciais:umaanálisepormeiodeumcorpusjornalístico 68CandiceGuaratoSantos 68

ALinguísticadeCorpuseminterfacecomAnáliseContrastivaePressupostosdaTradução:umapossibilidadedeauxílioparapromoçãodeautonomianaformaçãodoprofessordeLínguaInglesa–EstudodecasonoCampusXIVdaUNEB 70LavineCunha 70

Elaboraçãodeumprotótipodeglossáriobilíngue(português-inglês)detreinamentodeforça:subsídiosparaotradutor 70MárciadosSantosDornelles 70

RESUMOSMINUTODELOUCURA 74

AELIUSFALADO2.0:primeirospassos 75MônicaRigoAyreseGabrieldeÁvilaOthero 75

Alimentosregionaisbrasileiros:estatísticalexical,gênerotextualeacessibilidadetextual 76LauraDupkedeAlmeida 76

8

Aelaboraçãodeumdicionáriodeelementoscoesivoscombaseemcorpus 77DanielaFariaGramaeGuilhermeFromm 77

OrganizaçãotemáticadefolhetosinformativosparaaagricultoresfamiliaresdoBrasil:umestudobaseadoemcorpus 78GiselleFetter 78

Softwareparaalfabetizaçãodeautistasnomundodaastronomia 79GuilhermeQueirozVasconcelos,CinthyanRenataSachsC.deBarbosa,JoãoCoelhoNetoeFernandaMafort 79

MetáforassobrerefugiadosnojornalFolhadeS.Pauloem1994e1995 80LucianeCorrêaFerreiraeCatarinaValleeFlister 80

Planejamento,CompilaçãoeAlinhamentodeumCorpusParalelodeLiteraturaCanadense:traduçãoeretraduçãoemportuguêsbrasileirodeLifeofPi 81RaphaelMarcoOliveiraCarneiro 81

TheAngelinaJolieEffectinBreastCancerInformationSources:aCorpusStudy 81AnaLuizaPiresdeFreitas,AlineAverVanin,FernandaLopesdeSouzaandElianeRabin 81

TerminologiaEmpresarial:oRelatóriodeSustentabilidadeeasLinguagensEspecializadas 82CarolinaR.Ourique 82

Vocabuláriobilíngueportuguês/inglêsdeLinguísticaGeral:padronizaçãodoscorpora 83MárcioIssamuYamamoto 83

FluênciaeInteraçãonoinglêsparaaviação:umaanálisebaseadaemPragmáticaeLinguísticadeCorpus 84MalilaPrado 84

Análisecomparativadasescolhaslexicaisnatraduçãodecontosemlínguaalemã:umestudoexploratóriosobaperspectivadalinguísticadecorpus 85LucianeLeipnitz,TamaraBelmonteMunichGraf 85

Buscandoarepresentatividadedeumcorpusespecializado 86AnnaMariaMaciel,MárciaMouradaSilvaeRozaneRebechi 86

Oquesignifica(va)localnodiscursodomovimentoFarm-to-table? 87StellaTagnin 87

Épossívelfalaremestilodatraduçãoemlegendagem?Umapesquisabaseadaemcorpus 88JanailtonMickVitordaSilvaeAlessandraRamosdeOliveiraHarden 88

Utilizandocorporanapesquisadaterminologiadegêneronalegislaçãobrasileira 89ClarissaIsabelV.deOliveira 89

Ocâncerdemamaempalavras:umestudodecorpusnasinterfacesLinguística,InformáticaeSaúde 90AlineAverVanineAnaRachelSalgado 90

Amodalizaçãoavaliativaemresumoscientíficos:umestudodalínguaespanholacombaseemcorpus 91MaurenThiemyItoCeresereSandraDiasLoguercio 91

Oprocessodeorganizaçãoeetiquetagemdocorpuslinguístico“UFSM” 92SabrinaDamiani 92

9

EspecificidadesdovocabuláriodaobraContosGauchescos,deSimõesLopesNeto:umestudoexploratório 93NathaliaMarconeMariaJoséFinatto 93

Pesquisalinguísticacomcorporaememóriasdetradução 94LianaParaguassu 94

Analisandopacoteslexicaisemumcorpusmultinacionaldeportuguêsacadêmico 95TanaraZinganoKuhn,JoséPedroFerreiraeMargaritaCorreia 95

Ousodecorpusnodesenvolvimentodedicionárioseletrônicosorganizadosapartirdanoçãodeframe 96BrunadaSilva 96

AcorpusanalysisofthevocabularyfromBeyoncé’sLemonade 97NatashaBarthSidorukeAlineXavierdeVargas 97

Quandoaglobalizaçãoaflige:umestudocontemporâneodasvariedadesfonético-fonológicasemlínguainglesabaseadoemcorpus 97AdeilsondeJesusOliveiraJúnior 97

ArtigosCientíficossobreTranstornodoEstressePós-Traumático:DesafiosdaAcessibilidadeLinguísticaparaPúblicoLeigo 98AsafeDaviCortinaSilva 98

Atividadesdecompreensãooralcombaseemcorpora:umestudopiloto 98LucianoF.daSilva,PaulaT.PintoeElenDias 98

Ousodecorporamultimodaisnaconstruçãodeumdicionáriobaseadonanoçãodeframessemânticos 99SandradeOliveira 99

Ousodecorpusparaleloecomparávelparadescreverpadrõesdeusonatraduçãodeabreviaturaseacrônimosdetermosmédicos 100MárciaMouradaSilva,GabrielePaparellieGislaineAlves 100

Sobreacompilaçãodeumcorpusportuguês-inglêsderesenhasderestaurantesparafinstradutórios 101RozaneRebechi,AnaCristinaNevesNachtigall,HannahDosSantosKahneNatháliaGlasenapp 101

Propostadeumvocabuláriobilínguedefestaspopularesbrasileirasbaseadoemumestudodecorpus 102GiovanaMartinsdeCastroMarqueze 102

Extraçãoeanálisedepadrõesléxico-gramaticaisemartigosacadêmico-científicosemdiferentesáreas 103CristianeKilianeSandraLoguercio 103

Traduçãoautomática:vilãounemtanto? 104MicheldeSousaTeixeiraeCláudiaFreitas 104

Ousodalinguísticadecorpusecorporadeaprendizesparaaproduçãodeatividadesdidáticaseparaoensinodeinglêscomfinsacadêmicos 104AnnaLuisaLopesAlves 104

TextualDiscourseAnalysis:TowardsaPragmatic-ArgumentativeModelfortheInternationalLegalDiscourse 105HálisAlvesdoNascimentoFrança 105

10

Legendagem,CorporaeAnálisedoDiscurso 107ElaineTrindade 107

ElaboraçãodeTarefasPedagógicascomBaseemCorpus:ExplorandoRecursosLinguísticos 108AnamariaWelpeÁlvaroR.Didio 108

ComentCorpus:ousodemecanismoslinguísticosnadetecçãodeironiaesarcasmoparaoportuguêsdoBrasilemumcorpusopinativo 109GabrielaWickPedroeOtoAraújoVale 109

Lexicalbundlesacrossthemethodologyandresultssectionsofappliedlinguistcisresearcharticles 110LucianadeMacedo 110

AConstruçãodeumObjetoDigitaldeAprendizagem(ODA)paraaRedaçãodeResumosEstruturados:UmEstudoBaseadoemCorpus 111AnaElizaPereiraBocorny,BibianaSiebelFinkler,FernandaCorreaSoldatelli,LauraPires,RosanaBeatrizErnzeneVivianMeurerLameira 111

11

Resumos dos Minicursos, Minicursos Expressos e

Workshops Especiais

12

“ESQUENTA” ELC – GRANDES TEMAS E DIÁLOGOS COM LINGUÍSTICADE CORPUS – INTEGRATING CORPUS AND COGNITIVE LINGUISTICAPPROACHES IN LANGUAGE RESEARCH AND TEACHING: RATIONALESANDPRAXES

Palestrante:Dr.DilinLIU(DepartmentofEnglish,TheUniversityofAlabama)

This speech explores the rationales and existing efforts to integrate corpus andcognitive linguistic approaches in language research and teaching. Specifically,drawingonpublishedstudiesand focusingonchallenging language issues, suchasthe use collocations, collostructions, propositions, and synonyms, the speechdiscusses how combining corpus and cognitive linguistic approachesmay enhancethevalidityandreliabilityofresearchonlanguageuseandincreasetheeffectivenessoflanguageteaching.Thediscussionwillparticularlyhighlighthowthecombinationof the two approaches may help produce new insightful understandings aboutlanguageusage/acquisitionissuesthatcouldnotbeattainedotherwise.Thespeechends with a brief discussion of the challenges and future directions of combiningcognitiveandcorpuslinguisticapproachesinlanguageresearchandteaching.

MINICURSOA-INTRODUÇÃOAOPLN/ANÁLISEDESENTIMENTOS

Ministrante:Prof.Dr.ThiagoPardo(NILC/ICMC/USP)

Parte1:IntroduçãoaoPLN-Criaçãoeanotaçãodecorpora

Neste minicurso, serão apresentados os conceitos básicos da LinguísticaComputacional, introduzindo-seosníveis linguísticosusualmente tratadosealgunsrecursos, ferramentas e aplicações associados. Alguns corpora relevantes serãoapresentadosediscutidos,mostrando-secomoelestêmsidousadosnaárea.

Parte2:IntroduçãoàAnálisedeSentimentos

Serão apresentados os conceitos básicos da área de análise de sentimentos e osdesafios relacionados, que envolvem várias áreas, como Linguística, Psicologia eComputação. Alguns métodos de análise de sentimentos serão explorados,terminandocomumaatividadepráticasobreoassunto.

13

MINICURSO B - INTRODUÇÃO À LINGUÍSTICA DE CORPUS:COMEÇANDODOBÁSICO

Ministrante:Prof.Dra.RozaneR.Rebechi(IL/UFRGS)

Naprimeirapartedominicurso,apresentaremosaosparticipantesosfundamentosda Linguística de Corpus, partindo para um breve relato da sua aplicação para oensino de língua estrangeira, os Estudos de Tradução e a Terminologia. Serãodiscutidososconceitosdepesquisascorpus-basedecorpus-driven,eapresentadasas principais ferramentas de análise de corpora textuais e suas funções básicas:levantamentode listasdepalavras (wordlist), listasdepalavras-chave (keyword) elinhasdeconcordância(concord).

Asegundaparteserádedicadaàrealizaçãodeexercíciospráticosapartirdecorporadisponíveis on-line para o ensino, e de corpora especializados de pequenasproporçõesparaextraçãodeterminologiaebuscadeequivalentestradutórios.

MINICURSO C - COMO USAR O SKETCH ENGINE PARA ANALISAR OCOMPORTAMENTODASPALAVRAS

Ministrante:Prof.Dra.AnaFrankenberg-Garcia(UniversityofSurrey-UK)

Este workshop prático destina-se a todos que queiram aprender a utilizar aferramenta Sketch Engine para analisar o comportamento das palavras em umalíngua,variantelinguística,linguagemespecializada,traduçãoouemqualquertextoouconjuntodetextos.Nãosãonecessáriosconhecimentospréviosdecorpora.

O Sketch Engine é provavelmente a ferramenta de corpora mais avançada hojeexistente. É muito simples de usar e ao mesmo tempo permite efetuar análisesextremamentesofisticadas.Alémdedaracessoacentenasdecorporaemdiversaslínguas, prontos para serem interrogados, o Sketch Engine simplifica a criação decorpora faça-você-mesmo, ajudando a encontrar e preparar textos relevantes, aetiquetá-los com anotação gramatical e a deles extrair palavras-chave eterminologia.

Apósumabreveintrodução,esteworkshopabordaráousodoSketchEngineatravésde uma série de exercícios práticos. No final doworkshop, os participantes serãocapazes de: (1) utilizar as principais funcionalidades do Sketch Engine; (2) usar oSketch Engine para analisar questões linguísticas específicas; (3) criar um corpusespecializado;(4)extrairautomaticamentepalavras-chaveeterminologia.

14

MINICURSOEXPRESSOI-ASEMÂNTICAENCONTRAALEXICOGRAFIA-DICIONÁRIOSBASEADOSEMFRAMES

Ministrantes:SemanTec(Unisinos)

Esteminicurso,uma iniciativadogrupoSemanTec,propõe-sea tratardequestõesrelacionadasaodesenvolvimentodosdicionáriosField-DicionáriodeExpressõesdoFutebol (2014) e Dicionário Olímpico (2016). Merecerão destaque os seguintestemas: (i) Projetando um dicionário eletrônico baseado em frames, (ii) O uso decorpuseletrônicoetradução,(iii)LexicografiaEletrônica:demandaseexpectativas,(iv) Unidades lexicais: construindo a lista de verbetes e (v) A organização doscenárioseaestruturadodicionário.

Explore os dicionários do SemanTec: http://dicionariofield.com.br/ ehttp://dicionarioolimpico.com.br/

MINICURSO EXPRESSO II - ESTUDOS CONTRASTIVOS EMESPANHOL/PORTUGUÊSELINGUÍSTICADECORPUS

Ministrante:Prof.Dr.ArielNovodvorski(ILEEL/PPGEL/UFU)

O objetivo principal desta oficina é incentivar o desenvolvimento dos estudoscontrastivoscombaseemcorpus.Serãoapresentados,demodopráticoeobjetivo,conhecimentosespecíficosparaoempregodeferramentaspresentesnosprogramascomputacionais WordSmith Tools 7,0 (Scott, 2016) e ParaConc (BARLOW, 2001),além de recursos disponíveis no Corpus del Español e no Corpus do Português(DAVIES, 2016). Tudo será aplicado aos estudos contrastivos emespanhol/português, a partir do alinhamento e exploração de corpora paralelos etambémdotrabalhocomcorporacomparáveis,tantodoâmbitojornalísticoquantodelegendasdefilmes.

15

WORKSHOP ESPECIAL I - ESTUDOS CONTRASTIVOS EMESPANHOL/PORTUGUÊSELINGUÍSTICADECORPUS

Ministrante:Prof.Dr.GuilhermeFrommeProf.Dr.ArielNovodvorski(ILEEL/PPGEL/UFU)

Esteworkshopapresentaexperiênciasdeuma trajetória, construídanosúltimos8anos, na construção de um ambiente universitário favorável à multiplicação deestudosepesquisasbaseadosnaabordagemenasmetodologiasda LinguísticadeCorpus.Asexperiênciasdestacadas, ilustradasematividadesdeiniciaçãocientífica,extensãoepós-graduação,tratamdoestudo/trabalhocomcorporataiscomotextosdelegendasdeseriadosdeTVemdiferentesidiomas,legendasparacinema,estudoscontrastivos português-inglês-espanhol e textos de literatura infantil. Trazendo opasso-a-passo de nossos trabalhos, buscamos inspirar atividades de aula/ensino,futuraspesquisas,monografias,TCCs,estudos-pilotoeatéapontarpossibilidadesdetemasparafuturosmestradosedoutorados,nocenáriodaformaçãodeprofessoresedaformaçãodetradutores.

WORKSHOP ESPECIAL II - AVALIAÇÃO E SIMPLIFICAÇÃO -FERRAMENTAS E PESQUISAS COM CORPORA PARA O ENSINO EREESCRITADETEXTOS

Ministrantes:Prof.MA.AlineEverseProf.MA.BiancaPasqualini(UFRGS)

Resultados de pesquisas em Linguística de Corpus e Linguística Computacionalproduziramumasériederesultadoscapazesdequalificarotrabalhodeprofessorese de tradutores. Quais são esses resultados? Que ferramentas computacionaisdisponíveis podemos utilizar atualmente para otimizar uma série de tarefas queenvolvem avaliar e simplificar textos? Neste workshop, apresentaremos reflexõessobreasáreasdeavaliaçãodeproduçãotextualedesimplificaçãodetextosapartirdaperspectivadaLinguísticadeCorpus;traremossugestõesdeusodeferramentascomputacionais disponíveis com potencial de qualificar o trabalho de professores,tradutoreserevisoresdetexto;mostraremoscomoferramentasdeanálise textualpodem nos auxiliar a fazer uma leitura diagnóstica diferenciada de textos;mostraremoscomoessasmesmasferramentastambémpodemserúteisemtarefasdetraduçãointralinguísticavisandoasimplificaçãodeumtexto.

16

WORKSHOP CONVIDADO - USING CORPORA FOR LANGUAGELEARNINGANDTEACHING

Ministrante:Dr.DilinLIU(DepartmentofEnglish,TheUniversityofAlabama)

Thanks to rapid advancements in corpus linguistics and computer technology,corpora have become an increasingly popular tool for language learning andteaching.Understandinghowtousecorporainteachingisthusimportantfortoday’slanguage teachers. Using information from his book on corpus use in languageteaching recently published by TESOL, the facilitator introduces common usefulprocedures and activities for using corpora to teach various aspects of English,including vocabulary, grammar, and writing. Following the introduction, theparticipants will work both individually and in groups to develop corpus-basedlearningactivitiesthatpromotediscoverylearningfortheirownstudents.

PALESTRADE ENCERRAMENTODO ELC 2017 - INTEGRATING CORPUSAND COGNITIVE LINGUISTIC APPROACHES IN LANGUAGE RESEARCHANDTEACHING:RATIONALESANDPRAXES

Palestrante:Dr.DilinLIU(DepartmentofEnglish,TheUniversityofAlabama)

This speech explores the rationales and existing efforts to integrate corpus andcognitive linguistic approaches in language research and teaching. Specifically,drawingonpublishedstudiesand focusingonchallenging language issues, suchasthe use collocations, collostructions, propositions, and synonyms, the speechdiscusses how combining corpus and cognitive linguistic approachesmay enhancethevalidityandreliabilityofresearchonlanguageuseandincreasetheeffectivenessoflanguageteaching.Thediscussionwillparticularlyhighlighthowthecombinationof the two approaches may help produce new insightful understandings aboutlanguageusage/acquisitionissuesthatcouldnotbeattainedotherwise.Thespeechends with a brief discussion of the challenges and future directions of combiningcognitiveandcorpuslinguisticapproachesinlanguageresearchandteaching.

17

Resumos de Apresentações Orais

18

09

TOWARDS MACHINE TRANSLATION FROM BRAZILIAN PORTUGUESE-TO-LIBRAS:ACORPUS-BASED,MORPHOSYNTACTICANALYSIS

FranciscoAulísiodosSantosPaiva,PlínioAlmeidaBarbosa,PabloFariaeJoséMarioDeMartino

School of Electrical andComputer Engineering – FEEC/DCA –Universidade Estadual de Campinas(Unicamp)

[email protected];[email protected];[email protected],[email protected]

This paper presents a methodology for identifying morphosyntactic rules for BP-Libras machine translation. Since Libras does not have a widely accepted writingsystem, glosses will be used as an intermediate language. The knowledge-basedrulesarespecifiedonthebasisoftheanalysisofaBP-LibrasparallelcorpusandfromresultsofstudiesonLibrasgrammarappliedtothesentences'pairsofthecorpus.

11

THEMAKINGOFABILINGUALDICTIONARY

AnaFrankenberg-Garcia

CentreforTranslationStudies–UniversityofSurreyGuildfordGU27HX–ReinoUnido

[email protected]

Dictionariesrelyonboth introspectionandobservationtodescribehowwordsareused.Naturallanguageprocessinghasmadeitpossibletoobservelargeamountsofconcentrated language data in unprecedented ways. The Oxford PortugueseDictionary(Lópezetal.2015)wascompiledwiththeaidofelectroniccorpora,whichhave helped produce authentic, relevant entries, reflecting up-to-date usage, andnatural equivalences between English and Portuguese. A summary of thecompilationofthePortuguese-Englishsideofthedictionaryispresentedhere.

23

REPRESENTAÇÕES SOCIAIS PAN-AMERICANAS:UMESTUDOBASEADOEMTRIGRAMASDOGOOGLEBOOKS

TonyBerberSardinha,MariaClaudiaDelfino,RafaelAraujoPontifíciaUniversidadeCatólicadeSãoPaulo(PUCSP)

[email protected],[email protected],[email protected]

Esta pesquisa teve por objetivo identificar as representações comumenteconstruídas sobreasAméricaspormeiodaanálisedos trigramasmais recorrentesencontradosnaspublicaçõesdoGoogleBookseobservaçãodavariaçãotemáticaao

19

longodotempo.Oarcabouçoteórico-metodológicodestapesquisaéaLinguísticadeCorpus,cujabasemetodológicasefundamentanaAnáliseMultidimensionale,paratanto, utilizaremos os autores BIBER (1988 et seq.), BIBER et al (2001; 2009) eBERBER SARDINHA (2014 et seq.). A base metodológica dessa pesquisa é a AMD(BIBER,1988etseq.),definidacomoumaabordagemparaanálisedecorpusqueusaprocedimentos estatísticos (principalmente análise fatorial) e que se ocupa domapeamentodasassociaçõesentreconjuntosvariadosdecaracterísticaslinguísticasdentrodocorpusdeestudo(BERBERSARDINHA,2004).Apresentepesquisateveoobjetivo de revelar representações sociais comumente associadas aos povos docontinenteamericano (Norte-americanos, Latino-americanos,Central-americanoseSul-americanos)ao longodo tempo,construídasatravésdapreferência semântica,ou seja, um agrupamento de colocações (grupo lexical) que compartilha algumascaracterísticas semânticas (Hoey, 2005). Para tanto, foi realizada uma análise dacoocorrência das colocações mais salientes de um corpus formado por listas dostrigramasmais recorrentes,extraídoatravésda ferramentaGoogleNgramsViewer(Figura1)doGoogleBooksempublicaçõesemlínguainglesaentre1800e2008.Ocorpus do estudo, Pan American Corpus of Trigrams (PACT) foi compilado eprocessadoatravésdescriptdesenvolvidoespecificamenteparaestapesquisa,pormeio da extração dos bigramas individuais em cada subcorpora (North American,Latin American, Central American e South American) mais seus respectivoscolocados2 mais frequentes em livros digitalizados através da ferramenta OCR edisponibilizados pelo Google Books, totalizando 466.666.156.981palavras,2.429.890.866 páginas, e 4.520.002 publicações de 21 décadas (1800 à 2008),representando99,6%doacervototal,umavezqueumapequenafraçãodos livrosfoipublicadaantesde1800.Pormeiodaanálisequantitativapode-seinterpretarosfatores emdimensõesde variação (BIBER, 1988et seq.).Os resultadosobtidosnaanálisequalitativaparaconfirmaçãodashipótesesdeinterpretaçãodosfatores,emtermos de dimensões temáticas, por meio de exemplos extraídos dos textos docorpus,serãoapresentadoseilustrados.

28

IDENTIFICAÇÃODETERMOSNODISCURSOLITERÁRIODEFANTASIADASÉRIE HARRY POTTER EM UMA ABORDAGEM DIRECIONADA PORCORPUS

RaphaelMarcoOliveiraCarneiro

UniversidadeFederaldeUberlândia(UFU)

[email protected]

Estetrabalhorelataosresultadosdeuma investigaçãodirecionadaporcorpusqueobjetivou descrever o uso de unidades lexicais ficcionais como termos dentro douniversodediscursoliteráriodefantasia.Talcorpusécompostopelasseteobrasdasérie literária Harry Potter e outros três volumes que detalham omesmomundoficcionalcriadoporJ.K.Rowling.

20

38

CLUSTERING AND HIERARCHICAL ORGANIZATION OF OPINIONASPECTS:ACORPUSSTUDY

FrancielleAlvesVargaseThiagoAlexandreSalgueiroPardo

UniversityofSãoPaulo(USP)

[email protected];[email protected]

This paper consists of an empirical study on the problem of clustering andhierarchically organizing opinion aspects in product reviews in order to supportaspect-based opinion mining applications. We performed a corpus study forcharacterizing andunderstanding the involved tasks, looking for linguistic patternsandconvergencesanddivergencesacrossdomains.Theprocesshasbeenmanuallyperformedandresultedinreferencedataforfuturedevelopmentsandevaluationofautomaticmethodsinthearea.

43

REVISTA BRASILEIRA DE LINGUÍSTICA APLICADA: MULTIDIMENSÕESTEMÁTICAS

MariaAntonietaCelani,TonyBerberSardinha,MariaClaudiaDelfino,MarianneRampaso,RafaelAraujoeUlyssesDiegues

FaculdadedeTecnologiadePraiaGrande

[email protected]

Comointuitoderevelarosprincipaistemasmaisrecorrentesedemaior interessenas publicações da Revista Brasileira de Linguística Aplicada (RBLA) ao longo dotempo – essa pesquisa tem como objetivo identificar as dimensões temáticas –espaços linguísticos–que refletemosassuntosde interessee tratadoscommaiorfrequêncianaLinguísticaAplicada(LA)pormeiodainvestigaçãodoléxicodostextos,além de verificar se existe uma relação entre estes temas e o período de tempodesde a primeira publicação da revista. Essa pesquisa se fundamenta, por ser apublicaçãoemquestãoumdosprincipaisveículosdedisseminaçãodoconhecimentoconstruídonaLAbrasileiraeumavezque,atéapresentedata,nãoexistemmuitosestudos que se debrucem sobre a variação lexical e temática desta área doconhecimento,apresentepesquisasejustificaepretenderpreencherestalacuna.

21

45

ADDING INFORMATION IN ARGUMENTATIVE TEXTS: A LEARNERCORPUS-BASEDSTUDYOFADDITIVELINKINGADVERBIALS

JessicaMariadaSilvaQueiroz,JessicaCeritelloAlveseDeisePrinaDutra

UniversidadeFederaldeMinasGerais(UFMG)

[email protected],[email protected],[email protected]

Thepossibilitiesforstudyinghumanlanguagesofferedbycorpuslinguistics(CL)areendless.Since itsemergenceasapromisingmethodology,CLhasdeveloped intoa“heterogeneousfield”(McENERY;HARDIE,2012,p.1)thatallowslinguiststocollectandexploreindifferentlevelsalargeamountofauthentic languagedata.Thekindofdatacompileddependsonthepurposeoftheresearch,butitisusuallywrittenorspokenandrepresentativeofnativeorlearnerlanguage.Inourstudy,wedealwithlearner andnative language, but focusprimarily on learner corpora,which canbedefined as “electronic collections of foreign or second language learner textsassembledaccordingtoexplicitdesigncriteria”(GRANGER,2009,p.14).Thistypeofcorpusisanattempttoapprehendthelanguageproducedbylearnersfromoneorvariousproficiencylevels.Similarlytoanynativecorpus-basedstudy, investigationsbasedonlearnercorporahaveunraveledseveralfeaturesregardingthelexis,syntax,morphology, phonology, discourse, and phraseology of learner language (seeCOXHEAD, 2010 for an overview). Aiming to develop a contrastive interlanguageanalysis (CIA) (GRANGER,1996;1998),wehave selected theargumentativeessayswritten by B1 (intermediate) level university students from two Brazilian learnercorpora: theCorpusofEnglishwithoutBorders (CorIsF), and theCorpusofEnglishfor Academic Purposes (CorIFA). The two subcorpora contain 48,442 and 81,586word tokens, respectively. In addition, a native English corpus was used forcomparative purposes: the Louvain Corpus of Native English Essays (LOCNESS).LOCNESS was chosen as it contains a significant and comparative subcorpus ofargumentative essays with 228,920word tokens, written by American and Britishuniversitystudents.

52

ESTUDOS DE CORPORA NA TRADUÇÃO E TEORIAS DO HABITUS NAEDUCAÇÃO:UMOLHARSOBREOSBRASILEIRISMOSDEDARCYRIBEIROEMLÍNGUAINGLESA

TalitaSerpaeDivaCardosodeCamargo

IBILCE/UNESP;UniversidadeEstadualPaulistaJúliodeMesquitaFilho

[email protected];[email protected]

Com o objetivo de observar comportamentos linguísticos e também sociais noâmbito da prática profissional da tradução (direção português ↔ inglês),principalmente no que concerne ao uso de brasileirismos; e, a fim de fornecer

22

subsídios para o ensino e a aprendizagem dessas condutas, com base no uso decorporaenoempregodoconceitodehabitusnaformaçãodetradutores,realizamosuma associação entre bases epistemológicas, apoiando-nos na abordageminterdisciplinar proposta por Camargo (2005, 2007), e adotando o arcabouço dosEstudos Descritivos da Tradução (EVEN-ZOHAR, 1978; TOURY, 1978, 1995), dosEstudos da Tradução Baseados em Corpus (BAKER, 1993, 1995, 1996, 2000), daLinguística de Corpus (BERBER SARDINHA, 2004) e, em parte, da Terminologia(BARROS, 2004; FAULSTICH, 2004). Procuramos vincular noções sociológicas(SIMEONI, 1998; GOUANVIC, 1997, 1999, 2002, 2005; SELA-SHEFFY, 1997, 2000,2004, 2005; INGHILLERI, 2003, 2005a, 2005b) e pedagógicas voltadas aohabitus eaos saberes (BOURDIEU, 1980, 1982; PERRENOUD, 2000, 2001; TARDIF, 2002) àsdiscussões sobrecompetências (HURTADOALBIR,1993,1995,1999,2000,2001)esobre a utilização de corpora com tradutores aprendizes (ALVES, MAGALHÃES,PAGANO, 2000, 2005; TAGNIN, ALVES, 2010; ALVES, 2003; ALVES, MAGALHÃES,2004;FROMM,2008;BERBERSARDINHA,2010;CAMARGO,2011a,2011b;LAVIOSA,1995, 2008, 2009; ZANETTIN, BERNARDINI, STEWART, 2003). Em um segundomomentodapesquisa,procedemosacompilaçãodeumcorpusparalelocompostopela obra Maíra (1978), de autoria de Darcy Ribeiro; e pela respectiva tradução,realizada por Goodland e Colchie (1985). Também nos valemos dos glossáriosbilínguesdeAntropologiadaCivilização(2012),produzidoscombaseemduasobrasensaísticas do mesmo autor, de modo a cruzarmos os dados e observarmos asopções tradutórias, as quais, acreditamos, podem representar um conjunto dehabilidades passível de ser ordenado em atividades a serem adotadas em sala deaula (DÍAZ FOUCES, 1999). Metodologicamente, o programa WordSmith Tools(SCOTT,2004),emsuasferramentasWordList,KeyWordseConcord,proporcionou-nos o levantamento dos termos e a análise dos aspectos sociais e terminológicospresentes na formulação de uma proposta de experienciação de algunscomportamentosprofissionaisdotradutor.Dessemodo,tomamosporhipótesequeaobservaçãoreflexivasobreatraduçãodebrasileirismos,pormeiodaLinguísticadeCorpus,permite-nosfomentarumaPedagogiadaTraduçãopautadanainstruçãodohabitustradutório.QuantoaosprocedimentosdeGoodlandeColchie,osresultadosobtidosmostraram que os tradutores utilizaram: a) empréstimos da Língua FonteparaLínguaMeta;b)normalização;c) traduções literais;d)omissões,entreoutrostraços. Podemos citar, como exemplos de empréstimos usados nos textostraduzidos, alguns termos como: “caboclo”, “capanga”, “cauim”, “mameluco”,“mirixorã”,“oxim”,“paçoca”,“pajé”,“sariguê”e“tuxauá”.Osresultadosapontaramaindaparaaintensavariaçãonatraduçãodosbrasileirismos,fatorquepodepermitiraoestudantenotardistinçõesdesignificadoentretermos,principalmentenoquedizrespeito ao universo da sociedade brasileira, como, por exemplo, em: “boiada”:herd/herdingcattle/cattledrive;“cabra”:guy/man/hood/liar/shiftface/coward/plantation-hand/ gunman; “cantiga”: tune/ song; “celerado”: villainous/ ruffian;“cuia”: gourd/ calabash/ gourdful/ gourd cup, “maloca”: indian village/ slum/communalhut/hut;“miçangas”:beads/glassbeads/beadsornaments/littlebeads/crystalbeads;“palhoça”:hut/shack/thatchedhut;“pito”joint/pipe;e“sertanejo”:backwoodsman/ backlander/ man of sertão. Por fim, em um a terceira etapa,convertemos os dados e as teorizações em um exercício e aplicamos entre osmatriculadosemumcursodeBachareladoemLetrascomHabilitaçãoemTradução

23

deumaUniversidadePúblicadoEstadodeSãoPaulo.Procuramosfornecer-lhesumamplo cabedal de estratégias, a partir de glossários, listas de palavras de maiorfrequência e chavicidade, gráficos e quadros, os quais comporiam os alicerces desuas competências. Também desenvolvemos um trabalho em que os estudantespuderamverificarsuasprópriasescolhasparabrasileirismosnostextosdarcynianose conceber os principais aspectos relacionados à formulação de um habituscoparticipado e internalizado, discutindo suas diferentes interpretações. Asresoluçõestomadaslevaram-nosapensaremumaarticulaçãoentredistintasáreas,buscando fornecer subsídios para investigações que correlacionem a formação dotradutor com bases nos usos de tecnologias e corpora à composição de umaidentidade profissional do tradutor. Entendemos que quando os aprendizes sedeparam com o conceito de habitus e passam a realizar suas ações com base noconhecimento dessa conduta, relacionam-na a um status de classe profissional,verificandoquais são as competênciaspróprias àquela atividade. Issopermitequefortaleçam os vínculos e compreendam que há uma formação específica para otradutor, a qual está pautada nos elementos que compõemo comportamento daárea, o qual está relacionado, em muitos aspectos, a saberes específicos. Éimportante, por fim, ressaltar que nosso trabalho teve um caráter exploratório eprocurouincitarareflexãotantoporpartedosaprendizesdeTradução,quantoporparte dos pesquisadores e professores na área. Com esse breve exercício deassociaçãodedistintasciências, tencionamosdeslocarateoriaepromover leiturasqueproporcionemolhareseusosoriginais.

55

REPORTING ON THE DEVELOPMENT OF SKETCH GRAMMAR FORACADEMICPORTUGUESE

TanaraZinganoKuhneIztokKosem

UniversidadedeLisboa(CELGA-ILTEC),UniversidadedeCoimbra,UniversityofLjubljana&Trojina

[email protected],[email protected]

Automation of dictionary-making has recently reached the point envisaged byRundell and Kilgarriff (2011) in which data are automatically extracted from thecorpus and imported into dictionary writing system, where then lexicographersanalyse and edit the information. This was the method adopted in theconceptualisationandcompilationofamodelforanonlinecorpus-drivendictionaryof Portuguese for university students. At the heart of the procedure of automaticextractionofdatafromthecorpusareWordSketches–“aone-page,corpus-basedsummaryofaword’s grammatical andcollocationalbehaviour” (KILGARRIFFetal.,2004,p.105),whichareafeatureoftheSketchEnginetool(KILGARRIFFetal.,2004).Inordertobuildwordsketches,twoconditionshavetobemet.OneisaPOS-taggedcorpus, and the other is sketch grammar. This contribution reports on thedevelopmentofanewsketchgrammarforacademicPortuguese.First,weprovideabriefpresentationofthecorpus.Next,weofferasuccinctdescriptionofthesketchgrammar development, drawing attention to some of the main problemsencounteredandworkaroundsproposed.Finally,wesummarise themain findings,

24

highlight important implications of our research, and point out suggestions forfurtherimprovementofthesketchgrammar.Giventhatexistingcorporaandsketchgrammars for Portuguesewere unsuitable for our purposes,we had to compile acorpusof academic Portuguese, and, basedon it, devise a completely new sketchgrammar. The newly compiled corpus CoPEP - Corpus de Português Escrito emPeriódicos (CorpusofWrittenPortuguese inAcademic Journals) (KUHN&FERREIRA,2016) containsaround10,000 texts totallingover40millionwordsextracted fromacademicjournalspublishedontheBrazilianandPortuguesenationalcollectionsofSciELO (Scientific Electronic LibraryOnline). The texts are distributed among threeSchoolsofKnowledge,andfurtherdividedintosixGreatAreas.CoPEPisasynchroniccorpus,thevastmajorityofitstextshavingbeenpublishedbetween2000and2016(only2%oftextsarefromthe1990s).Thesubcorporaforeachlanguagevarietyareof almost the same size and consist of a similar number ofwords per bothGreatAreasandSchools,makingthecorpusevenlybalanced.Sketchgrammarisafilewithgrammatical relations,orgramrels,andprocessingdirectives for theSketchEnginesystem to compute different types of relations through statistics calculations. Thedata obtained with these computations then form the basis of the Word SketchfeatureintheSketchEngine,andrelatedly,theThesaurusandSketchDifffeatures.SketchgrammarsdevisedforPOS-taggedcorporauseregularexpressionsoverPOS-tagstofindmatchesforgrammaticalrelations.QueriesarewritteninCorpusQueryLanguage (CQL), with attribute-values names following the tagset used for corpustagging. Devising the sketch grammar for academic Portuguese (henceforthAcadPortSkG)consistedoftwophases:1.writinggramrelqueriesutilisingasmallersamplecorpusand2.evaluationoftheperformanceofthesketchgrammardevisedin the first phase on the entire CoPEP corpus. The first phase adopted a trial anderrormethod,wherequerieswerewrittenandtestedseveraltimesuntilsatisfactoryresults were reached. Then, we moved to the evaluation of the resulting sketchgrammar on the entire CoPEP data with the objective of verifying whether thedevised gramrel queries captured correct information. This second phase thusentailed compiling the CoPEP corpus in the Sketch Engine using AcadPortSkG,defining a methodology of evaluation, conducting the evaluation, and proposingworkarounds for gramrels in which annotation problems seriously affected theresults.ThecurrentversionofAcadPortSkGcomprisessymmetric(1),unary(5),dual(14), and trinary (2) grammatical relations covering attributive (pre- andpostpositional) and predicative adjectives; nouns as predicative complement,subjects,andobjectsof verbs (unmarkedorder);prepositionalphraseswithnounsand verbs; infinitive as verb/noun complement; impersonal and personal verbalpassive constructions; verbal constructions with pronoun se; verbs followed byclauses introduced by que and other conjunctions; verbs with gerund as acomplement;andadverb-verbandadverb-adjectivepairs.Thisnewsketchgrammarfor academic Portuguese has had implications not only for our work on thedictionaryofPortugueseforuniversitystudents,butalsoforPortuguesecorporaingeneral.AcomparisonwiththedefaultsketchgrammaravailableforFreeling-taggedcorpora of Portuguese revealed that AcadPortSkG comprises a larger number ofgrammatical relations for nouns, verbs and adjectives, and many new rules foradverbs,thusbroadeningupwordclasscoverage.Inaddition,thequeriesofexistingsketchgrammars,whichwereconsulted indevelopingAcadPortSkG,wereadapted

25

and now yield better results. Lastly, AcadPortSkG contains queries which werecarefully devised in a way to overcome detected annotation errors, making thesketchgrammarmoreaccurate.Especiallyimportantisthatthisnewgrammaryieldsvery rich results, both in terms of quality and quantity - most of the times, itproducesmore data than can be handled by a human, which is in fact typical ofsketchgrammars forautomaticextractionof lexicaldata (KOSEMetal.2013).TheproposeddictionaryofacademicPortuguesecannowtakemaximumadvantageofthis new approach in lexicography, meaning that lexicographers can get vastamounts of structured informationdirectly into thedictionary-writing system. Therichness of the lexicographic evidence obtained from the corpus due to theunderlying sketch grammar is thus manageable, enabling compilation of moreaccuratedictionaryentries.AcadPortSkGcanalsobeusedwithanyothercorpusofPortuguese tagged with Freeling 3.0. Such corpora will benefit from our sketchgrammaron two levels. In termsof their exploration, usersof the corporawill beable to conduct a more thorough and reliable lexical analysis due to a greaternumber of grammatical relations and their (improved) accuracy. Concerning thedevelopment of tools for Portuguese, the very process of sketch grammardevelopmenthasrevealedproblemswithcorpusannotation,andthiscanbeusedinfinding solutions to improve the Freeling tagger and informing other resourcedevelopersofpotentiallyproblematicareas.Wewillcontinuetoimprovethesketchgrammar, but as the current version already yields very good results, for bothacademic and general Portuguese, we decided to make it available in the SketchEngineforresearchersusing/makingFreeling-taggedcorporaofPortuguese.

65

POMMERSCHEKORPORA:UMCONJUNTODECORPORADIALETAISDAVARIEDADEBRASILEIRADOPOMERANO

NeubianaSilvaVelosoBeilke

UniversidadeFederaldeUberlândia(UFU)

[email protected]

Introdução: A nossa pesquisa demestrado teve comoobjetivo principal realizar acompilação de corpora do pomerano no Brasil. O pomerano é uma variedadelinguísticagermânica,poispertenceaotronco indo-europeueàfamíliadas línguasgermânicas, estando situado dentro do grupo do baixo-alemão, proveniente dasterras planas do norte da Europa. Referimo-nos especificamente ao PommerschesPlattdeutsch(VOLLMER,2008;HERRMANN-WINTER,1998,2003,2013),ouseja,aobaixo-alemãopomerano.Emnossotrabalho,optamosporadotarvariadostiposdefontesparaacomposiçãodeumconjuntoformadoporcorporaescritos(constituídopordiários,músicas,poemas,receitas,livrosetc.)eporumcorpusoral,compostoapartir de entrevistas sociogeolinguísticas que foram realizadas com falantes depomeranoe,posteriormente, transcritas,a fimdecontribuirparaadocumentaçãodo pomerano. Objetivos: Nosso objetivo geral foi compilar materiais autênticosprovenientesdodialetopomeranonoBrasilparaconstituiçãodeumbancodedadoslinguísticos (corpus). Nossos dois objetivos específicos foram identificar a

26

sobrevivência ou o desaparecimento do pomerano nas regiões alvo de nossapesquisa – no entorno do Vale do Rio Doce/MG e no interior do Rio Grande doSul/RS – e comparar brevemente o pomerano coletado nessas duas regiões.Fundamentação Teórica:Paraalcançaros referidosobjetivos,oestudo tevecomofundamentaçãoteóricaaLexicologiaeaLinguísticadeCorpus(LC),precisamente,asteorias que fundamentam a abordagem-metodologia da LC. Ademais, dada anatureza interdisciplinar desta pesquisa, contemplamos também as noções daSociogeolinguística (SGL), campo de estudo que subsidiou nossa coleta de dadosorais. Os princípios do empirismo e da perspectiva descritiva também inspiraramnosso trabalho. Entre nossos referenciais, encontram-se autores como Biderman(1992,2001);ZavagliaeWelker(2013);Sinclair(1991,2004),Fillmore(1992),Perini(2006,2008);BerberSardinha(2004),Tognini-Bonelli(2001),Parodi(2010),FinattoeNovodvorski (2014); Raso e Mello (2009), Mello (2012); Araújo (2012); Cristianini(2007, 2012), Takano (2013), Von Borstel (2014), dentre outros. Após pesquisas ereflexões bibliográficas, definimos que, para nós, a LC é uma abordagem-metodologiadeprincípiosdescritivos,quesefundamentaemdadosautênticoseserelaciona com as evidências de maneira ampla, utiliza metodologia de pesquisaempírica, permite a produção de conhecimentos variados fundamentados narealidade linguística, além de nos guiar na investigação de hipóteses nãopremeditadas e na descoberta e comprovação de fatos linguísticos. Hipóteses:Formulamosquatrohipótesesparaestapesquisa:i)acogitaçãodequeopomeranonão é ágrafo, pois a coleta e compilação de corpora demonstra a existência deformasescritas; ii)a ideiadequeos falantessãoencontrados,emgrandemaioria,no meio rural, podendo ser inexistente, em algumas localidades, a presença defalantesdepomeranonazonaurbana;iii)averificaçãodeinterferênciasdecaráterlinguístico sofridas pelos pomeranos em contato com outras etnias; e, iv) aconsideraçãodequeo contatodosdescendentesdepomeranos comoportuguêstenhapermitidoosurgimentodeumavariedadebrasileiradopomerano.Dentreasquatrohipóteses,trêsforamconfirmadas,tendosidonegadaapenasaquelaqueserefere à presença de falantes de pomerano limitados às zonas rurais, pois foipossível encontrar falantes em zonas urbanas, como Itueta/MG e Canguçu/RS.Metodologia: Nossa metodologia, de modo geral, envolveu a coleta, compilação,transcrição e tratamento de dados escritos e orais, bem como a convenção e aconversão da escrita em um padrão único (uniformizado, dentro do contexto danossa pesquisa) para as amostras linguísticas pomeranas. Para a coleta de dadosorais, adaptamos o Questionário Sociolinguístico (QS) e o Questionário SemânticoLexical (QSL), este último para a versão em alemão Lexikalisch-SemantischerFragebogen(LSF);selecionamosalgumaslocalidadespararealizarmosvisitaspréviase pesquisas a fim de fazer a caracterização histórico-geográfica das localidades,conformeaSociogeolinguística(SGL);organizamosumplanoderecrutamentocomcritériosde inclusãoeexclusãodoscandidatosàsentrevistas,segundoasvariáveisdaSGLeasexigênciasdoCEP(ComitêdeÉticaemPesquisascomSeresHumanos);realizamos, também, procedimentos para a efetivação das entrevistas, como, porexemplo,apreparaçãodosinstrumentosdecoletaetestagemdométodopormeiodarealizaçãodeentrevistaspiloto.Fizemosacoletanasseguintes localidades:VilaNeitzel/MG; Itueta/MG;ArroiodoTigre/RS;SãoLourençodoSul/RS;Canguçu/RSeSantaMaria de Jetibá/ES. Decidimos realizar coleta de dados em SantaMaria de

27

Jetibá/ES, por ser conhecida como a capital pomerana do Brasil e também parapermitir futurascomparaçõescomopomeranoencontradoemoutras localidades.Após a coleta, efetuamos o tratamento dos dados orais, quando foi necessáriodesenvolver um método de transcrição, o qual foi feito com base na ortografiagermânica dodicionárioDudene da bíblia pomerana (a Barther Bibel), e tambémrealizamos os procedimentos de etiquetagem parcial e de exclusão de dadosantroponímicos. Ainda sobre os procedimentosmetodológicos para a constituiçãodos corpora pomeranos, organizamos todo o material compilado como umaunidade, processo durante o qual realizamos a codificação, nomenclatura,agrupamento, separação e reagrupamento dos dados, segundo suas classificaçõesem diamesias ou gêneros ou domínio discursivo ou suportes. Neste trabalho,utilizamos o OmniPage®, o ArcGis®, oWordSmith Tools® e o SubExtractor® comorecursos tecnológicos. Tambémelaboramosuma listagemdos textosque constamnos corpora, bem como fizemos arquivamento de segurança do conjunto doscorpora via drive virtual online. Resultados: Ao final, obtivemos um conjunto dedadosnomeadoPommerscheKorpora(PK),quecontémquatorzecorporaescritos,asaber:o(i)CorpusdeInscriçõesdosTúmulosPomeranos;o(ii)CorpusdeLivrosdeRegistrosEclesiásticos;o(iii)CorpusdeCartasPessoais;o(iv)CorpusdeReceitas;o(v)CorpusdoJornalFolhaPomerana;o(vi)CorpusdeTextosDiversosdaInternet;o(vii)CorpusdeLegendasdeDocumentários;o(viii)CorpusdeTrabalhosAcadêmicos;o(ix)CorpusdeTextosReligiosos;o(x)CorpusdeMúsicasPomeranas;o(xi)CorpusLiterárioPomerano;o (xii)Corpusde Livros;o (xiii)CorpusdeSprücheDiversos;o(xiv) Corpus de Palavras Soltas; e um corpus oral, a saber o (xv) Corpus Oral deEntrevistas Interativas. O Pommersche Korpora Escritos - PKE totalizou 79.290tokense15.515types.OPommerschKorpusOral–PKOtotalizou50.376tokense7.309types.Oconjuntodetodososcorpora–oPommerscheKorporaouPK–emtodasassuasdiamesias,modalidadesegêneros–constituiumacervoestatísticode129.666tokense20.672types,oqual foiclassificadocomodetamanhopequeno-médio (conforme parâmetro de BERBER SARDINHA, 2004) e contém dados quepermitem identificá-lo como como um conjunto de corpora dialetais multilínguescontatuais,vistoquereúneléxicopomeranoautêntico,tantododialetoativoquantode textos históricos, contendo inclusive amostras linguísticas em pomerano, emalemão-padrão, em hunsriqueano e em português, todos dentro de um mesmotexto. Avaliamos que, por meio dos resultados alcançados em nosso trabalho demestrado, conseguimos preencher a lacuna no que diz respeito à ausência depesquisas acerca de regiões (como, por exemplo, a região leste deMinas Gerais)compresençadefalapomerananoBrasiletambémàausênciadecríticaaotrabalhode Tressmann (2008); apresentamos documentos históricos para abordar aimigração pomerana; debatemos a questão acerca do pomerano ser língua oudialeto;desenvolvemosprocedimentosdetratamentosdedadosoraisdialetaiseummétodo de consulta à bíblia pomerana de 1588; ampliamos o leque de fontes decoleta de dados linguísticos e fragmentos dialetais; fizemos transcrições dedocumentos históricos e fontes primárias (inclusive em letra gótica). Quanto àanálise qualitativa dos resultados alcançados, esboçamos análises prévias sobrefatos linguísticosdirecionadospeloscorpora.Verificamos,combasenasevidênciasencontradas no PK, a existência de um pomerano que apresenta influênciasportuguesas, alemãs e dialetais (de outras variedades germânicas), por isso o

28

chamamos de Brasilianisch-Pommersch, ou seja, uma variedade brasileira dopomerano.Encerramosnossotrabalholançandoperspectivasfuturasparaoestudodopomerano,comsugestõesdiretasdedesdobramentosfuturospossíveispormeiodotrabalho iniciado,taiscomo:expansãodoscorporadoPK;transformaroPKemmonitor;etiquetagemcompleta;estudodosverbosesubstantivosmaisfrequentesnoscorpora;estudodosdadosdopontodevistadocontatodelínguas;produçãodeumatlaslinguísticoparcial;produçãodemateriaisdidáticoscombaseemevidênciasempiricamente coletadas (evitando a formulação de frases artificias paraexemplificações); utilização dos dados como ferramenta auxiliar na traduçãopomerano-alemão-padrão; levantamento de hipóteses sobre a sintaxe pomerana;estudosdeperdasdealguns fonemasegrafemasnasposições finaisdaspalavras;auxílio na produção de obras lexicográficas; análise sociolinguística com base nasrespostasobtidaspormeiodaaplicaçãodoQS;comparaçãocomosdadosdeoutroscorpora (Ex. Corpus of Historical Low German/Corpus do baixo-alemão histórico)e/ou Referenzkorpus Mittelniederdeutsch/Corpus de referência do baixo-alemãomédio). Portanto, acreditamos e almejamos ter deixado uma contribuição para acompilaçãodeoutroscorporadialetais.

67

A ESCRITA DE PAULO COELHO: DO VOCABULÁRIO À COMPLEXIDADETEXTUAL

ViníciusAlcesMachado

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

São descritas as escolhas lexicais de um conjunto de obras do escritor e místicoPaulo Coelho (PC), tomado como corpus de estudo, em contraste com obras deAugusto Cury (AC), autor conhecido no estilo de literatura de auto-ajuda. Comocorpus de referência, utiliza-se o Corpus Brasileiro (BERBER SARDINHA, 2013),complementado com a lista de entradas do Dicionário Ilustrado de Português deM.T.C.Biderman,umdicionárioassociadoaouniversovocabulardeestudantesdoEnsinoFundamental.Essedicionárioservecomoumareferênciaparaverificaçãodeescolhaslexicaiscompatíveis,emtese,compúblicodemenorescolaridadeepoucohábitodeleitura.Osdadosdoscorporadeestudoecontrasteforamgeradoscomosprogramas AntConc (ANTHONY, L., 2014), Flesch Calculator (WILKENS, 2016) eComparetwolists(WhiteheadBaRCpublictools,2013).OsresultadosmostramqueamaioriadasmilpalavrasmaisfrequentesdasobrasdePCintegramodicionáriodeBiderman,oque,somando-seaofatodeapalavra“QUE”ocuparaprimeiraposiçãodas palavras mais frequentes, permite supor uma escrita próxima da oralidade evocabulário acessível para leitorespoucoexperientes. Semelhanteocorre comAC,sendo “de” a palavra mais frequente, o que permite refletir que o uso de umvocabulárioconsideradomenoscomplexosejaimportantenoapreçodopúblicoporessasobras.

29

68

COLOCAÇÕES ESPECIALIZADAS NA ÁREA DO DIREITO COMERCIALINTERNACIONALEPROPOSTADEGLOSSÁRIOTRILÍNGUE

JeanMichelPimentelRochaeAdrianeOrenha-Ottaiano

UniversidadeEstadualPaulista(UNESP);UniversidadeEstadualPaulista(UNESP)

[email protected],[email protected]

Estapesquisa,ancoradanoaporteteóricodaLinguísticadeCorpusedaFraseologia,teve por objetivo desenvolver um estudo teórico-metodológico acerca dosprocedimentos necessários ao levantamento e à análise sintático-morfológica,léxico-semânticae tradutológicadas colocaçõesespecializadasextraídasdocorpusparalelo, em inglês e em espanhol, constituído pelos anuários (1968-2010) daUNCITRAL(ComissãodasNaçõesUnidasparaoDireitodoComércioInternacional);ededoiscorporacomparáveisemportuguês:umcompiladopelaferramentaBootCatFrontEnd(ZANCHETTA;BARONI;BERNARDINI,2011)e,outro,pelacoletadetextosonline da área do Direito Comercial Internacional. Com base neste estudo,determinamos as colocações funcionalmente equivalentes (TOGNINI-BONELLI;MANCA,2004)emportuguêseelaboramosumapropostadeglossáriotrilínguenasdireçõestradutóriasinglês-espanhol-português,naáreasupracitada.

70

FRAMESDECOMPREENSÃOECORPORA:ESTUDODECASOCOMUSODAFERRAMENTASKETCHENGINE

AlineNardesdosSantoseRoveChishman

UniversidadedoValedoRiodosSinos(Unisinos)

[email protected],[email protected]

EstetrabalhoabordaousodaferramentaSketchEngine(KILGARIFFetal.,2004)nadescrição linguístico-cognitiva de frames de compreensão (ZIEM, 2014),caracterizados como estruturas de conhecimento esquemáticas ativadas pelosfalantes conforme seus conhecimentos demundo. O estudo de caso apresentadomostracomoousodoSketchEngine,principalmenteda ferramentaWordSketch,facilitaaidentificaçãodeevocadorespotenciaisdoframeanalisado.

30

71

O QUE AS RESENHAS DE VIAJANTES PODEM NOS DIZER SOBRE ACULTURA?ALINGUÍSTICADECORPUSAJUDAARESPONDER

SandraNavarroUniversidadedeSãoPaulo(USP)

[email protected]

EstetrabalhotemcomoobjetivoinvestigarasdiferençasculturaisentreoBrasileosEstadosUnidos,pormeiodaanáliselinguísticabaseadaemumcorpusderesenhaspublicadasporviajantesbrasileiroseamericanosnositeTripAdvisor, interpretandoosresultadosapartirdasteoriassobreorientaçõesculturais(HALL,1977;WALKERetal., 2003; KATAN, 2004). O objetivo deste estudo está em acessar as orientaçõesculturaispormeiodaobservaçãodospadrõesdalinguagem.Adotamos,portanto,aperspectiva postulada pela Linguística de Corpus, segundo a qual a linguagem éconstituída de padrões não aleatórios e consagrados pelo uso, que recebemsignificadoapartirdedeterminadocontexto(SINCLAIR,1991).Ocorpusconstruídopara este estudo contém resenhas de viajantes retiradas do site TripAdvisor eescritas em inglês por americanos e em português por brasileiros. Esse conteúdoestá subdividido em quatro categorias: resenhas de americanos sobre hotéis nosEUAehotéisnoBrasil e resenhasdebrasileiros sobrehotéisnosEUAehotéisnoBrasil. O corpus está balanceado, com 5000 resenhas em cada idioma, 892.085palavraseminglêse499.094palavrasemportuguês,totalizando10.000resenhase1.391.179 palavras. Os achados descritos apontam para diferenças culturais emtermos de orientação de pensamento (WALKER et al., 2003). A cultura americanaprivilegia o pensamento linear e indutivo. Essa forma de raciocínio enfatiza fatosconcretos,estatísticas,medições,exatidão,privilegiaalógicacausaeefeito.Assim,aodescreverumaexperiência,oamericanobuscaformasconcretasdeexpressarsuaavaliação,porexemplo,estabelecendoumpontodereferência,um“padrão”,oqueexplica o uso recorrente de ‘standards’. Por sua vez, a cultura brasileira tende aopensamento sistêmico e dedutivo, que enfatiza uma abordagem integrada ouholística. Esse ponto de vista concentra-semenos nos fatos concretos emais nasconexõesentreaspartes,comousofrequentedeanalogias,metáforas,símiles.Issoexplica a ausência de referências recorrentes a um “padrão” determinado comocritérioparaavaliações.Osdadostambémpodemser interpretadosemtermosdeorientação de ação (WALKER et al., 2003). Essa orientação distingue entre duasformasdemotivação,serefazer.Asculturasvoltadasaofazer,comoaamericana,não encontram dificuldade em separar fatos de sentimentos pessoais. Assim, épossível criticar a ação sem que isso implique necessariamente uma crítica àidentidade da pessoa. Em contraste, em culturas orientadas ao ser, como abrasileira,umacríticaéfacilmentecompreendidacomoumataqueàidentidadedapessoa. Essa diferença pode ser confirmada pelos distintos usos de ‘Brazilian’ e‘brasileiro’ no corpus. Ao avaliar como inferior a qualidade de alguns hotéisbrasileiros, os americanos pautaram suas opiniões em padrões objetivos, daí acolocação ‘by Brazilian standards’, o que indica uma realidade demercado e nãonecessariamente um ataque à nacionalidade brasileira. Para o brasileiro, é difícil

31

fazer essa distinção. Constatou-se que uma pesquisa que visa comparar padrõesculturaisapartirdepadrõesdalinguagempodeproduzirresultadosqueenriquecemnossa consciência cultural, não apenas em relação auma cultura estrangeira,masemrelaçãoànossaprópria.

73

ELABORAÇÃO DE UM CORPUS DE COMUNICAÇÕES PILOTO-CONTROLADOR EM LÍNGUA INGLESA – QUESTÕES TEÓRICAS EMETODOLÓGICAS

PatriciaLucks

UniversidadeEstadualPaulistaJúliodeMesquitaFilho

[email protected]

A aviação civil tem se desenvolvido e aumentado exponencialmente nas últimasdécadas, tantonoBrasil quantoem todoomundo.Porém,apesarde se tratardeuma área que exige os mais rígidos padrões de treinamento de pessoal e demanutençãodeequipamentos,essecrescimentoemlargaescalatambémtemfeitoaumentaronúmerodeincidenteseacidentesaéreos,quepodemsercausadosporumacombinaçãodediferentes tiposde falhashumanase/ou tecnológicas.Dentreelas,existeapossibilidadedefalhanacomunicaçãoentrepilotosecontroladoresdetráfego aéreo, o que pode ocorrer em virtude de deficiências na proficiêncialinguísticadessesprofissionais.Hádiversaspesquisasque apontamproblemasnascomunicaçõescomofatorescontribuintesdeacidentesaéreos (cf.CUSHING,1997;PRINZO e MORROW, 1999; EUROCONTROL, 2006; MONTEIRO, 2009). Assim, aproficiência em língua inglesa é considerada uma ferramenta fundamental para asegurança das comunicações aeronáuticas que envolvem o tráfego aéreointernacional, sobretudo porque os profissionais precisam utilizar o inglês comolíngua franca para se comunicar com falantes nativos e não-nativos, das maisvariadas nacionalidades. Para garantir essa proficiência, a Organização de AviaçãoCivil Internacional (OACI) publicou, em2004, umdocumento conhecido comoDoc9835 (OACI, 2004; 2010) que estabelece os requisitos para a capacitação e aavaliação de pilotos e controladores que atuamem tráfego aéreo internacional, afim de que esses profissionais tenham competência para se comunicar em línguainglesa com segurança, principalmente em situações em que seja necessárioextrapolarousodaFraseologiaAeronáuticapadrãoeutilizaralínguainglesacomum(plainEnglish).Contudo,porsetratardealgomuitorecente,sãoaindaescassososestudosacadêmicossobreessalinguagemtãopeculiar,bemcomosobreaeficiênciados requisitos da OACI para de fato assegurar a segurança nos céus. Dentre aspesquisas já realizadas,destacamosalgunsestudosqueseapoiaramnaLinguísticade Corpus (cf. BOCORNY, 2008; SARMENTO, 2008; ALIZIERI, 2010; LOPEZ, 2013; ePRADO, 2015). Esses trabalhos são fundamentais para uma melhor descrição ecompreensãoda linguagemaeronáutica,poisdemonstramqueénecessárioqueaOACI reveja algumas determinações de seus documentos normativos (OACI, 2004,2009,2010).Afimdeoferecerumacontribuiçãoparaessesestudos,nestetrabalho,apresentamos a compilação de um corpus eletrônico oral a partir da coleta e

32

transcrição de gravações das comunicações rotineiras e não rotineiras, em línguainglesa, entrepilotose controladoresde tráfegoaéreodo SistemadeControledoEspaçoAéreoBrasileiro(SISCEAB).Oprincipaldiferencialemrelaçãoaocorpusaquiapresentado (chamadodecorpusSISCEAB)eosoutros jáexistenteséqueeste setrata do primeiro corpus compilado no Brasil nessesmoldes, 100% composto porinterações realizadasnoespaçoaéreobrasileiro, oquepossibilitará estudos sobrecontroladores brasileiros que são falantes de inglês, com diferentes níveis deproficiência,esuasfacilidadesedificuldadesdecompreensãodiantedefalantesdeinglês de diversas nacionalidades, também com diferentes níveis de proficiência.Asgravaçõesforamcoletadasdurantedoisanos,emlocalidadescomfluxo intensode aeronaves comerciais civis internacionais, a fim de compor uma amostrasuficientemente representativa das situações alvo emdiferentes regiões doBrasil,nos três órgãos operacionais que se comunicam com aeronaves durante asdiferentes fases do vôo (Torre de Controle, Controle deAproximação e Centro deControle de Área). O método para transcrições foi o sugerido por Raso e Mello(2012) para linguagemoral e, para questões específicas da aviação, analisamos assoluções propostas por Nevile (2004), Fox (2013) e Prado (2015). As transcriçõesforam inseridasna ferramenta computacionalWordsmith Tools (Scott, 2016). Essaferramenta possibilita a realização de um tratamento dos dados linguísticos, quepermite, como resultados, a realização de vários tipos de análises, por meio doprocessamento de um grande volume de informações, eletronicamente, demodouniforme,preciso,rápidoecientífico.AseleçãodessesoftwarefoifeitaapartirdoestudodasobrasdeBerber-Sardinha(2004,2006),TagnineVale(2008)eTagnineViana (2011). Neste trabalho, daremos ênfase à metodologia empregada nastranscrições e seus desafios, pois a comunicação piloto-controlador tem muitasespecificidadesdedifícilcompreensãoparaquemnãoestáinseridonessaatividadeoumesmonocontextodomomentoda fala.Por isso,acreditamosqueapesquisaaquiexpostatambémapresentaumacontribuiçãoaosestudossobretranscriçãodecorpus oral, tema ainda carente de mais estudos, principalmente no Brasil.O corpus SISCEAB contém um total de aproximadamente 20 horas de gravaçõesefetivamente utilizadas e 210.969 palavras. Foram cobertos diversos temas derotina, não rotina e emergência, o que confere ao corpus representatividade ebalanceamento.Épossívelaplicarfiltrosparaverificardadosrelativossomenteaumórgão operacional (como APP, por exemplo), ou a uma localidade específica ouregião.Tambémépossívelrealizarconsultasporpalavras-chave,temas,colocados,concordâncias.OcorpusSISCEABpossibilitaráarealizaçãodepesquisastantosobreaanáliseedescriçãodalinguagempiloto-controladorquantosuasaplicaçõesparaoensino-aprendizagem e para a avaliação de proficiência com esse fim específico,notadamente áreas que necessitam de mais estudos, como apontado na últimaAssembleia da ICAO, realizada em outubro de 2016. Poderá também auxiliar nacríticaàescaladeproficiênciaatualmentepropostapelaOrganização Internacionalde Aviação Civil para avaliação desses profissionais, e na proposta de uma escalacom base em dados mais científicos. Por fim, espera-se que os benefícios dapesquisaextrapolemoâmbitoestritamente linguístico,epossamcontribuirparaasegurançaoperacionaldotráfegonoespaçoaéreobrasileiro.

33

74

COMPILANDO CORPUS PARA APOIO À TRADUÇÃO: TRADUZINDO“TRADUCCIÓN Y TRADUCTOLOGÍA – INTRODUCCIÓN A LATRADUCTOLOGÍA”

MarinaWaquil UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

O presente trabalho tem como base a tradução inédita do espanhol para oportuguês de uma das principais obras da área da tradução: “Traducción yTraductología - Introduccióna laTraductología”,daautora,professorae tradutoraespanhola Amparo Hurtado Albir (2001). A obra é a 21amais citada nos estudossobrea tradução, sendoaúnicapublicaçãoeditadano séculoXXI e, alémdisso, aúnicaemlínguaespanholaentreascinquentamaisreferenciadas(FRANCO,2010).OtextodeHurtadoAlbirtemcaráterfundamentaleéreconhecidamentepopularnosestudos com foco na tradução, sendo extremamente abrangente ao discutir asdiversas definições da tradução, suas características e as principais noções deanálise.É,também,democrático, jáquedávozaosmaisdiferentesteóricoseseuspontosde vista epressupostos.Assim, apartir da1) realizaçãoda traduçãodestetexto, estabelecemos como objetivos, também, 2) identificar os problemasterminológicos de tradução decorrentes do processo, apresentando,consequentemente, as soluções propostas para os mesmos, e 3) elaborar umglossáriobilíngueespanhol/português, compostopor termoscoletadosdaobradeHurtadoAlbir e seus respectivosequivalentes. Parao cumprimentodestas etapas,compreendemos a necessidade de execução de uma fase fundamental para apesquisa e para a obtençãodosobjetivos estipulados, isto é, a preparaçãodeumcorpus que servisse de guia para 1) encontrar equivalentes em português paraunidadesdo textooriginal, 2) resolverosproblemasdecorrentesda traduçãoe3)paravalidarasunidadesterminológicascandidatasaentradasnoglossárioproposto.Este corpus, sua elaboração e posterior utilização, representa, em nossoentendimento,umaetapafundamentaldentrodapesquisa,jáquetrabalhamosemum contexto de linguagem especializada, a da área da tradução. Desta forma, atraduçãorealizadanãoversasobreumtextocomum,massobreumtextoquetemumcaráterespecializado(evidenciadosegundooscritériosdeCABRÉ,2001)e,porisso, apresenta características próprias da terminologia da área. Deste modo,buscando mediar com adequação e precisão uma comunicação especializada,acreditamosserfundamentalabuscaeconfirmaçãoporequivalentesterminológicose, por isso, procedemos à compilação de um corpus de referência da área datradução no qual pudéssemos realizar esta etapa. Portanto, para sua compilaçãobaseamo-nos na proposta de um dos grandes pesquisadores em Linguística deCorpusnoBrasil, Berber Sardinha, queentendequeumcorpus éum conjuntodedados “construído a partir de um desenho explícito, com objetivos específicos”(BERBER SARDINHA, 2000, p. 335). Para o autor, existem quatro pré-requisitosbásicos para a compilação de um corpus, os quais buscamos seguir na presente

34

pesquisa.Emprimeirolugar,aautenticidadedoconteúdo,istoé,paraaformaçãodeumcorpus,ostextosqueocompõemdevemserautênticos,tendosidoescritosemlinguagemnaturalesemquetenhamsidocriadoscomopropósitodeseremobjetosde estudo de pesquisa linguística. Seguindo esse critério, selecionamos artigos derevistas e periódicos brasileiros de destaque no campo da tradução que sãoautênticos, escritos em linguagem natural e cujo propósito é a difusão doconhecimentoespecializado(CadernosdeLiteraturaeTradução–USP;CadernosdeTradução – UFSC; Revista Traduzires – UnB; Tradterm – USP; Tradução ecomunicação–AnhangueraEducacional;TraduçãoemRevista-PUC/RIO;Translatio–UFRGS).Aindaemrelaçãoàautenticidadeestáosegundocritério,emreferênciaaosautoresdostextos,demodoque,comexceçãodealgunscasos,comooexemplodoscorporadeaprendizes,ostextosselecionadosparaacompilaçãodeumcorpusdevemtersidoescritosporfalantesnativosdalínguanaqualestãoescritos.Paraocorpusdestetrabalhoselecionamostextosescritosestritamenteporpesquisadoresfalantes nativos de português brasileiro. O terceiro requisito é que a atividade sebaseie em uma seleção criteriosa, isto é, que os textos para a formação de umcorpussejamescolhidosdeformaqueestetenhaalgumacaracterística,apartirderegras especificadas pelo(s) pesquisador(es). Seguinte esse critério, selecionamostextos do gênero artigo acadêmico publicados em revistas e periódicos deuniversidadesbrasileirasespecializadosnocampodatradução,jáquenossoobjetivoera ter um corpus de textos compostos pela linguagem que o caracteriza.Finalmente,compõeoquadroderequisitosarepresentatividadeque,noentanto,étambémvistacomoproblemáticaporBerberSardinhaemfunçãodadificuldadeemidentificarcritériosobjetivosparadefini-la;estepré-requisitodeveservirparaqueocorpus seja representativo deuma língua, variedade, campoespecializado etc.Nocasodestetrabalho,selecionamosumcorpusde346textos,equase2,4milhõesdepalavras,cujaextensãoefiabilidadederamcontadapesquisaaserrealizadaedosobjetivos estipulados para a sua utilização. Com este corpus compilado, além deutilizá-loduranteoprocessodetradução,buscandoe/ouconfirmandoequivalentes,procedemos à análise terminológica que, segundo Tebé e Cabré (2004, p. 221,tradução nossa1), é fundamental já que “assim, o tradutor pode visualizar comalgum grau de certeza os tipos de problema que terá que enfrentar e de quaisrecursosprecisará”.Dividindoestaetapaemtrês,primeiro,analisamosocorpusdetradução, o texto de “Traducción y Traductología”; logo, o corpus de textoscompilados sobre tradução em português; e, por fim, comparamos os dadosterminológicosobtidosdeambososcorpora, comoobjetivodeadiantarpossíveisquestões problemáticas para a tradução. Durante esta análise, alguns dos passosmetodológicos aplicados foram a elaboração de stoplists em espanhol e emportuguês,combasenasproduzidaspelogrupoTermisul,ainserçãodasstoplistsedos corpora de textos na ferramentaWordsmith Tools e a análise dos resultados,observandocommaiordetalheas150unidadesmaisfrequentesindividualmenteecomparativamente. A partir desta análise, chegamos a algumas conclusõesnorteadoras do seguimento do trabalho: por um lado observamos uma clarasemelhança na estruturação linguística do conhecimento da área da Tradutologiaentre os dois idiomas, comumnúmero extremamente significativo de termos emcomumnasduaswordlists.Asimplesanálisedaspalavrasmaisfrequentesdeambasé suficiente para demonstrar esta semelhança, posto que as seis unidades mais

35

frequentes de cada idioma, por exemplo, são praticamente as mesmas:traducción/tradução, texto/texto, traductor/tradutor, lengua/língua,original/original com variação apenas na ordeme no número em texto/textos, noespanhol,e tradutor/tradutores,noportuguês.Noentanto,emboraesteresultadoindique uma correspondência significativa entre a linguagem especializada daTradutologia e a estruturação terminológicadamesmaemambosos idiomas, poroutro lado, algumas diferenças significativas também foram constatadas, já quetermoschavedaáreaocupamposiçõesextremamentedistantesemambasaslistas.Otermoequivalencia,porexemplo,representaumadasprincipaisemaisdiscutidasnoçõese,emboranawordlistemespanhol tenha frequênciaalta,ocupandoa18aposição,comumtotalde342aparições,na listaextraídadocorpusemportuguês,encontramosotermoapenasna426aposição,com280apariçõesemumconjuntodetextosdeaproximadamente2,4milhõesdepalavras.Conclusivamente,aanáliseterminológica prévia à tradução demonstrou que embora existam semelhançasevidentesnointeressetemáticodoconhecimentoespecializadodaTradutologiaemambasaslínguas,osenfoquesdiferembastante,oqueseevidencianafrequênciadeusodostermos.Assim,combasenocorpuscompilado,naanálisefeitanomesmoenasuacomparaçãocomotextooriginal,pudemosobservaralinguagemdaáreadatradução, em espanhol e em português, em contextos reais de utilização,entendendosuaestruturaçãoeantevendoquestõesrelevantesparaarealizaçãodatradução.Neste trabalho, nossoobjetivoé apresentar as etapasde construçãodocorpus,asferramentasutilizadasediscutirosresultadosaquechegamos.

1Nooriginal:Así,eltraductorpuedevisualizarconunaciertaseguridadquétipodeproblemasdeberáresolver,yquétipoderecursosnecesitaráteneramano,yensumacalcularquéesfuerzolevaarepresentareltrabajodetraducciónyquizá,deformaorientativa,enquétareasserepartiráestetrabajo.

79

READBD!(THBSIMPLES!)

HeloísaOrsiKochDelgado,DéboraMontenegroPasineCarmenVernetti PontifíciaUniversidadeCatólicadoRioGrandedoSul (PUCRS), InstitutodePrevençãoePesquisaemÁlcooleDrogaseoutrasDependências(IPPAD)

[email protected],[email protected],[email protected],[email protected]

Oestudopropostotratadasimplificaçãodalinguagempsiquiátrica,adoTranstornodoHumorBipolar (THB),paraa comunidadecompoucaalfabetizaçãona saúde.Aideiaépreencheralacunaexistenteentreosprofissionaisdasaúdeeseuspacientesatravés de um guia de bolso intitulado Read BD! (em inglês) e THB Fácil! (emportuguês do Brasil). O material explicativo conterá linguagem simples paradescrever esta doença de difícil entendimento, resultado da combinação deabordagensquantitativasequalitativasOsíndicesFlescheoCoh-Metrixmedirãoonível de complexidade do corpus através das categorias de narratividade,simplicidade sintática, concretude lexical, coesão referencial e coesão lógica.Estratégiasdeparáfraseeomissão,dentreoutras,serãousadasparaalcançaríndices

36

de simplificação adequados. Questionários serão aplicados e seus resultadoscomparadosaessesíndicesparaassegurarumtextodefácilcompreensão.

82

LEITURA DE ARTIGOS CIENTÍFICOS ANGLÓFONOS NA EDUCAÇÃOPROFISSIONAL:CORPORA,LÉXICOESPECIALIZADOEENSINO

AndreaJessicaMonzón

InstitutoFederaldoRioGrandedoSul(IFRS)/UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

Na formação acadêmico-profissional de alunos de cursos técnicos e tecnológicos,existeademandapelaleituradeartigoscientíficoseminglês.Osobjetivosprincipaisdeste estudo foram investigar o léxico especializado anglófono na Computação eobservar comoos alunosdessa área lidamcomas idiossincrasias terminológicas ediscursivas na leitura de LE. Para tanto, os dados foram coletados e analisadosatravésdacompilaçãocorpora,doisexperimentoscomaprendizes-alvoeentrevistascom educadores. Os resultados apontaram para a importância da observação dasnecessidades linguísticas, pedagógicas e profissionais dos alunos aliada àinvestigação de gêneros textuais especializados para a construção de estratégiasdidáticasrelevantes.

88

LC E ANÁLISE DO DISCURSO COM ENFOQUE NO ESTILO DO TEXTOLITERÁRIO TRADUZIDO: ITENS LEXICAIS ESTRANGEIROS EM THINGSFALLAPART

CristinaLazzerini UniversidadeFederaldeMinasGerais(UFMG)

[email protected]

EsteartigoenfatizaarelevânciadasferramentasemétodosdaLinguísticadeCorpuspara a análise do discurso com enfoque nos traços de estilo de textos literáriostraduzidos.Baseia-seemumestudosobreousodeitenslexicaisestrangeirosemumcorpus paralelo. A LC possibilitou a identificação de padrões de uso dos itens e aintegração de abordagens linguísticas e literárias. Os resultados mostram que,emboraaestratégiausadapeloautorparaainserçãodevocabulárioibonoromancetenhasidoseguidapelostradutoresparatraduzirositens,asmudançasdetraduçãoanalisadasapontamaconstruçãodesignificadosdistintosnas traduções,motivadaporusodiferenciadodositens.

37

90

“EUQUERO CESÁREA”OU “JUST CUT ITOUT!”: ANÁLISE CRÍTICADODISCURSO DE RELATOS DE PARTO APÓS CESÁREA DE MULHERESBRASILEIRASEESTADUNIDENSESÀLUZDALINGUÍSTICADECORPUS

LucianaCarvalhoFonsecaPontifícia Universidade Católica de São Paulo (FAFICLA/PUCSP) e Universidade de São Paulo(FFLCH/TRADUSP)

[email protected]

Este artigo apresenta minha tese de doutoramento em Estudos Linguísticos eLiterários em Inglês pela Universidade de São Paulo (Carvalho, 2014 e 2015). Oproblema social que motivou a pesquisa foi o fato de que, no Brasil, a maioriaabsolutadasprimíparas,desejapartonormal logoqueengravida,porém,emmaisda metade dos casos, os nascimentos são cirúrgicos. O fenômeno da falta decorrespondênciaentreodesejadoeoefetivamentealcançadonãoéexclusividadedas mulheres brasileiras, mas ocorre em vários países do ocidente. Por meio daAnáliseCríticadoDiscurso(ACD)derelatosdepartonormalapóscesárea(relatosdeVBAC, do inglês, vaginal birth after c-section) à luz da Linguística de Corpus (LC),buscamoselucidaroproblemasocialentrea faltadecorrespondênciaentreotipodeexperiênciadesejadaeaexperiênciaobtida.OdiscursodosrelatosdeVBACnosparece ser o discurso ideal para desvelar os elementos dessa falta decorrespondência,poisabordamtantoaexperiênciadacesáreaanteriorindesejadae,emregra,mal indicada, comoadopartodesejadoealcançado.O recorte teórico-metodológico adotado reúne a ACD (Fairclough, 1989, 1992, 2003; Chouliaraki &Fairclough,1999);aLC(Stubbs,1993,1996;McEnery&Wilson,1996McEneryetal.2003, Tognini-Bonelli, 2001) e a Análise Crítica do Discurso Baseada em Corpus(Bakeretal2008;Baker,2013;Baker&McEnery,2005;Flowerdew,2014).Nafaseda contextualização do problema social, foram analisadas as expressões damídiasobre o evento ‘parto’ e ‘nascimento’. Verificou-se que a mídia nos apresenta ereapresentaaolongodanossavidaideiasquedesempenhamumpapelsignificativona construção individual e coletiva do que entendemos por nascer e parir. Arespectiva análise revelou ideologias e relações de poder que, em seus múltiplosempregos,apresentamooxímoro–‘partocesárea’–igualando-oa‘cirurgia’,sendoa mulher operada em uma ‘sala de parto’. Constatou-se que o ‘parto cesárea’ érepresentado como ‘opção’ da mulher, em uma construção discursiva – eterminológica–queperpetuamitos sobreo ‘partonormal’masevidencia comooimpactodamodernidadenodiscursopublicitário–disfarçadodenotícia–empacotaexperiênciasdevidademodoavendê-lascomobensdeconsumopormeiodeumaficçãoterminológica.Poroutrolado,nogênerorelatosdeparto,serãoapresentadosos colocados do termo ‘parto’ – ‘parto natural’, ‘parto humanizado’, ‘partodomiciliar’etc.–eavinculaçãodesuasacepçõesàmedicinabaseadaemevidênciasesuacontraposiçãoà‘cesárea’,tendoemvistaque‘partocesárea’nãoéumtermoempregadonogênerotextualdosrelatos,apesardeserumtermoqueavançouatémesmo sobre os gêneros oficiais do Ministério da Saúde. Após esta imersão nosdiscursosquecircundamosrelatosdeparto,foicompiladoumcorpuseletrônicoem

38

inglês e português. O corpus é composto por textos escritos pelas mulheres quepassaram pela experiência de VBAC e não inclui textos mediados (entrevistas erelatos escritos por terceiros não foram incluídos). O Corpus BRABA (Corpuseletrônicoderelatosdepartodemulheresbrasileiras,estadunidenses,britânicaseaustralianas) se divide, respectivamente, em quatro subcorpora: Corpus BRA (93relatos, 250.807 palavras), Corpus EUA (101 relatos, 225.736 palavras), CorpusUK(97 relatos, 92 197 palavras) e Corpus AU (92 relatos, 200. 639 palavras). OsprimeirosdoissubcorporaCorpusBRAeCorpusEUAforamselecionadosparaestapesquisa que pretende investigar como as identidades e a experiência donascimento são representadas nos relatos demulheres brasileiras e americanas epormeiodessainvestigaçãochegaraelementosqueelucidemoproblemasocial.Oprocessamentoeletrônicovaleu-sedoprogramaAntConc3.4.0w(Anthony,2012)edas ferramentas da LC (listas de frequência, lista de palavras-chave, linhas deconcordância,padrões lexicais,etc.).Aanálise foidirecionadapelaspalavras-chavequecorrespondemaossujeitosenvolvidosepeloscolocadosmaisestatisticamenterelevantesdessaspalavras.NoCorpusBRA,foramanalisadas:eu(colocados:desisto,renasci, mamava); bebê (encaixado, morrer/morresse, sexo, batimentos, alto);marido(companheiro,apoiou,cortou);doula(amada,obstetriz,querida,presença);médico (fofa/fofinha, mudar/mudei, cesarista, ginecologista, humanizada);anestesista; enfermeira (obstétrica/obstetra, cadê, soro, chamar); parteira (liguei/ligar, doula, casa); obstetriz (doula, toque). No Corpus EUA: I (wish, protested,lamented);baby(pound,girl,boy);midwife(certified,asst/assistant,student,assist);doula (hired, friend, called); nurse (practitioner, tells, triage); doctor (office, seen,comes);anesthesiologist;husband(poor,run,children).Aanálisepermitiuquefosseelucidadooproblemasocialemambasassociedadesefossemreveladasdiferençasdiscursivaseculturais.Afaltadecorrespondênciaentreaexperiênciadesejadaeaalcançada é representada como tendo sido causada pela sucessão de eventosdistintos. Contudo, em ambos os corpora, as experiências são representadas e aautoidentidadeeasidentidadesconstruídasdiscursivamentesobaégidedostraçosda modernidade, marcadamente, em relação à reflexividade exercidaideologicamente. Porém, a reflexividade é operada, não só como um modo desustentar, mas principalmente como forma de transformar as relações dedominação.

91

A CORPUS LINGUISTICS STUDY ON BRAZILIAN STUDENTS’ ACADEMICVOCABULARYPROFILEVOCABULARYPROFILE

LarissaGoulartdaSilvaeAnaPaulaSeixasVial UniversityofWarwick,UniversidadeFederaldoRioGrandedoSul(UFRGS)l

[email protected],[email protected]

Theaimof this study is to explore theuseof academic vocabulary in a corpusbyBrazilian students by answering a) what is the vocabulary profile of assignmentswrittenbyBrazilianstudents?;andb)howdoesitcomparetothevocabularyprofileofotheracademiccorporapresentedintheliteraturereview?Todoso,acorpusof

39

assignmentswrittenbyBrazilian studentswas compiledandanalysedusingRangeandSketchEngine.TheresultsshowthatthecorpusbyBrazilianstudentspresentsthesamecoverageofacademicwordsasotheracademiccorpora.

94

FERRAMENTADEAUXÍLIOÀPRODUÇÃODEREDAÇÕESESCOLARESEMLÍNGUA PORTUGUESA: PASSOS PARA A CLASSIFICAÇÃO DE GRUPOSTEXTUAIS

AlineEverseMariaJoséBocornyFinattoUniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected],[email protected]

Estetrabalhoapresentaosresultadosiniciaisdeumapesquisaemandamentosobreavaliaçãoautomáticade textos (ATT) emportuguêsbrasileiro. Sãoapresentados3estudos-piloto realizados a partir de um corpus de redações escolares. Padrõeslexicaisecoesivossãodescritosparadoisconjuntosdetextosseparadosdeacordocomseusdesempenhosemumexame(altoebaixodesempenho).Adescriçãodosestudos-piloto e dos resultados obtidos servirão para a elaboração de umaferramentadeauxílioàproduçãoderedaçõesescolares.

99

PROFICIÊNCIA ESCRITA EM LÍNGUA INGLESA PARA A PRODUÇÃO DEABSTRACTSEMCIÊNCIASDASAÚDE:UMESTUDODECORPUS

AnaLuizaPiresdeFreitaseMariaJoséBocornyFinatto

UniversidadeFederaldeCiênciasdaSaúdedePortoAlegre(UFCSPA),UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected],[email protected]

Este estudo investiga a proficiência de autores brasileiros na redaçãode abstractsemCiênciasdaSaúde.Ainvestigaçãoorganizou,descreveueanalisouumcorpusde180.170palavrasemMedicina,NutriçãoeFarmácia.Pacotes lexicais forameleitoscomo unidade analítica. A partir das métricas de frequência e variação, ossegmentosbrasileiroe internacionalapontaramdistinçõesnas formasdeconstruiruma narrativa científica. O subcorpus brasileiro apresentou maior repetição deassociações de palavras e maior emprego de pacotes lexicais para expressarfinalidadeeregistrararealizaçãodotrabalhoacadêmico.Naconclusão,reporta-seacriação de um ambiente virtual de aprendizagememdesenvolvimento a partir dapesquisa.

40

100

UMA ABORDAGEM PARA IDENTIFICAÇÃO DE PERIÓDICOSESPECIALIZADOSNOCAMPODASHUMANIDADESDIGITAIS

FranciscoL.daCunhaeGyzelyS.Lima

Instituto Federal de Educação Ciência e Tecnologia do Triângulo Mineiro - Campus UberlândiaCentro

[email protected],[email protected]

Este artigo apresenta os resultados iniciais de um projeto de pesquisa emandamento (PIBIC-CNPq), cujo objetivo é investigar o uso de métodos digitaisquantitativos e computacionais que apóiam a prática de pesquisadores no campodas Humanidades Digitais. Através do uso da metodologia de MapeamentoSistemático, pretendemos fazer um levantamento da literatura sobre pesquisarelacionada às aplicações de métodos digitais na análise de textos literários nasHumanidades Digitais. Neste estágio de pesquisa, apresentamos uma lista de 15periódicos representativas do campo de Humanidades Digitais que foramidentificadas pela análise de 26 listas de bibliografia recomendada publicadas porespecialistas.

103

DICIONÁRIO OLÍMPICO: DESAFIOS E ESTRATÉGIAS PARA O USO DECORPORANACONSTRUÇÃODEUMDICIONÁRIOTEMÁTICO

RoveChishmaneDiegoSpaderdeSouza

UniversidadedoValedoRiodosSinos(Unisinos)

[email protected],[email protected]

A presente comunicação tem o objetivo de discutir e apresentar os desafios e asconsequências do uso de corpora textuais na construção do Dicionário Olímpico,desenvolvidoe lançadoem2016pelogrupodepesquisaSemanTec–SemânticaeTecnologia, da Universidade do Vale do Rio dos Sinos – UNISINOS, sob acoordenaçãodaProfa.Dra.RoveChishman.ODicionárioOlímpico(disponívelparaconsulta em www.dicionarioolimpico.com.br) é um recurso lexicográfico bilíngue(português-inglês)doléxicodos42esportesolímpicos.Odicionárioestábaseadonoarcabouço teórico-metodológico da teoria da Semântica de Frames, desenvolvidapor Charles J. Fillmore (1982; 1985). A Semântica de Frames, sendo uma dasprincipais hipóteses da Linguística Cognitiva para a descrição do significado(SALOMÃO, 2013), postula que, ao compreendermos o significado de uma dadaunidadeouexpressão linguística,estamos, simultaneamente,acessando,emnossamemória de longo prazo, uma estrutura conceptual que armazena informaçõesadquiridasatravésdaexperiência;essaestruturasedenominaframe.Dessemodo,entenderosignificadodegarçom,porexemplo,éomesmoqueentenderoqueéumframedeRESTAURANTE(CROFT;CRUSE,2004).NoDicionárioOlímpico, issose

41

traduzemumaformadupladeconsultaàinformaçãolexical:alémdeumalistadeverbetesorganizadaalfabeticamente,tem-se,também,umalistadeframes(quesãochamados de cenários na interface do dicionário). Cada unidade lexical estárelacionadaaum frame,de formaqueadescriçãodo significadoestá vinculada auma cena maior, que contextualiza o uso da palavra ou expressão. Todas asunidadeslexicaiseasinformaçõesquepossibilitaramadefiniçãodoscenáriosforamextraídasdecorporatextuais.ODicionárioOlímpicosurgiucomoumaextensãodeum projeto anterior, que resultou no Field – Dicionário de Expressões de Futebol(CHISHMAN, 2014, disponível em www.dicionariofield.com.br), recurso trilíngue(português-inglês-espanhol) da linguagem do futebol, também baseado naSemânticadeFrames.OdesenvolvimentodoField foimarcadoporumaextensaecriteriosa metodologia embasada na Linguística de Corpus, tendo sido utilizado osoftware Sketch Engine (KILGARRIFF et al, 2014, disponível emwww.sketchengine.co.uk)empraticamentetodasas fasesdeextraçãoeanálisedainformação linguística. De início, pensou-se em replicar a mesmametodologia naconstrução do Dicionário Olímpico, o que logo mostrou-se desafiador eproblemático. O primeiro problema encontrado foi a escassez de material paracomporoscorpora,tantoemportuguêsquantoeminglês.NocasodoField,foramconstruídostrêscorporadecercadeummilhãodepalavrascadaapartirdetextosdogêneromatchreport(cf.SCHMIDT,2008),quenarraosacontecimentosdeumadada partida esportiva. No contexto do Dicionário Olímpico, percebeu-se que apouca popularidade da grande maioria dos esportes resultava em uma baixadisponibilidadedematerial.Nessesentido,recorreu-seamanuaisderegrasoficiaisetextosdidáticosdisponibilizadoson-lineporconfederações,treinadores,esportistase, até mesmo, professores de Educação Física. Esses corpora, montados a partirdessetipodematerial,possibilitaram,antesdemaisnada,a familiarizaçãocomosesportes.Apartirda leituramanualdesses textos,portanto, foipossível fazernãoapenas a coleta das unidades lexicais de cada modalidade, mas tambémcompreenderadinâmicadosesportes,oqueauxiliounoprocessodedefiniçãodosframes–a leituradosmanuaisaindapermitiuaconstruçãodemapasconceituais,queorganizaraminformaçõesenciclopédicasdeorganizaçãodosesportes.Ocorpusem inglês foiutilizadoparaaextraçãodeequivalentesde traduçãoedeexemplosem língua inglesa. O problema da escassez de material no gênero match reporttambémseapresentounessecaso,eomaterialem línguaestrangeira tambémfoicoletadoapartirdeconfederaçõeseprofissionaisdaáreaesportiva.Avalidaçãodosequivalentesdetraduçãoeabuscapormaisexemplos,quesefeznecessárianocasodeesportesdebaixíssimapopularidade,comootirocomarco,levouàutilizaçãodawebcomocorpus,deformaqueforamfeitaspesquisasemsitesdebusca,comooGoogle,nointuitodeconfirmaralgumasinformações.Nessesentido,ametodologiadawebcomocorpus(cf.GATTO,2012)tambémfoiummeioutilizadoparasuprirafaltadecorporamaisrobustos,quepudessemserprocessadosemsoftwarescomooSketch Engine. Vale salientar, também, que o projeto contou com atletasprofissionais, professores e técnicos que atuaram como consultores, avaliando ecorroborandoasinformaçõescoletadas.Aindaquenãotenhasidopossívelfazerusoda mesma metodologia do Field – Dicionário de Expressões do Futebol, asestratégias encontradas pelo grupo de pesquisa SemanTec possibilitaram que,mesmoassim,todasas informaçõespresentesnoDicionárioOlímpicotenhamsido

42

extraídasdetextosnaturalísticos.Alémdisso,osgênerosutilizados–regrasoficiaisemanuais didáticos – permitiram um estudo profundo dasmodalidades esportivas,dosconceitosqueoscompõemedadinâmicaqueexisteentre todasaspartesdecada esporte. Tendo isso em vista, entendemos que, apesar de a metodologiautilizadanãoapresentar,deformaalguma,asofisticaçãodastendênciasmaisatuaisdaLinguísticadeCorpus,permitiuquetodooestudolinguísticoedesenvolvimentododicionáriofossefeitoapartirdedadosnaturalísticos,extraídosdomundoreal,oque se relaciona diretamente com o posicionamento filosófico-epistemológico daSemânticadeFrames(e,deformageral,daLinguísticaCognitiva):alinguagemestá,aomesmotempo,nomundoenamentedosfalantes.

105

ESTUDODECASOBASEADOEMCORPUSSOBREOPERFILESTILÍSTICODEUMTRADUTORLITERÁRIO

CarolinaBarcellos

Departamento de Línguas Estrangeiras e Tradução/ Instituto de Letras, Universidade de Brasília(UnB)Brasília,DF–Brasil

[email protected]

Considerando os estudos de estilo da tradução, no contexto dos Estudos daTradução baseados em Corpus (BAKER, 2000; SALDANHA, 2011; WALDER, 2013),este trabalho apresenta um estudo dos traços estilísticos de um tradutor literáriosob a perspectiva da convencionalidade e da análise de mudanças na tradução(shifts).Oobjetivofoiverificaraexistênciadeumconjuntodepadrõesdeescolhasdo tradutor a respeito da convencionalidade (BAKER, 2007) em língua portuguesabrasileiraquepudesseserencontradotantonosseustextostraduzidosquantonosseustextosnãotraduzidos,easconsequênciasdessasescolhasparaaconstruçãodesignificado nos textos traduzidos. Foram investigadas também as mudanças natradução identificadas no cotexto de ocorrência dos elementos deconvencionalidade analisados a fim de se obter mais informações sobre aspreferências linguísticas do tradutor (PEKKANEN, 2010; BLAUTH 2015). Saldanha(2011), parte do trabalho pioneiro de Baker (2000) sobre estilo da tradução emcorpus comparável, propondo uma abordagem combinada para investigação doestilodotradutoreestilodotexto traduzidoemcorpusparalelo,aqualpermitiriadiferenciarmarcasdoestilodotradutordasinterferênciasdoestilodosautoresdostextos-fonte. Baker (2007) inaugura o estudo da convencionalidade associado aoestilodotradutor,valendo-sedeumcorpuscomparáveleapontaanecessidadedeaprofundarsuainvestigaçãoemumcorpusparalelo.Munday(2008),queinvestigaoestilodotradutordeumaperspectivadistintadosEstudosdaTraduçãobaseadosemCorpus,encontraindíciosdepadronizaçãodavozdosautoresquandotraduzidosporummesmo tradutor e associa o uso da convencionalidade à criatividade.Walder(2013)partedosresultadosdessestrabalhoseinvestigaasescolhasdeumtradutoratravés do cotejamento entre um corpus de textos traduzidos e de textos nãotraduzidos desse tradutor/autor. No contexto do GRANT, Magalhães e Barcellos(2015) e Magalhães e Blauth (2015) enfocaram o estilo do tradutor em corpus

43

paralelosemtratarespecificamentedaconvencionalidadeemtextostraduzidosoude sua relação com a criatividade do tradutor. A presente pesquisa se propõe apreencher as lacunas encontradas nos trabalhos citados, investigando aconvencionalidade relacionada explicitamente à criatividade, da perspectiva doestilodotradutoredotextotraduzidoemumcorpusdeestudoqueenglobatextostraduzidosenãotraduzidosdeummesmotradutor/autor.Paraestapesquisa,foramcompiladostrêscorpora:1)umcorpusdetextostraduzidosparaalínguaportuguesabrasileiraporPauloHenriquesBritto,2)umcorpusdetextosnãotraduzidosescritosemlínguaportuguesabrasileiraporPauloHenriquesBritto,e3)umcorpusparalelode contos escritos em inglês americano, dos autores Philip Roth, John Updike, eJhumpa Lahiri, e suas traduções para o português brasileiro, de Paulo HenriquesBritto. Foram utilizados ainda dois corpora de consulta (COMPARA e ESTRA) paraobter frequências de referência, em língua portuguesa brasileira, quanto aoempregodoselementosdeconvencionalidadeinvestigadosnostextosdeBritto.Naprimeira fase desta pesquisa, foramanalisados os dados estatísticos do corpus deestudo obtidos com o auxílio do programa WordSmith Tools© 6.0 e foi feita acontabilização de elementos relacionados à convencionalidade (BRITTO, 2012) emlínguaportuguesaemváriosníveis(morfema,palavra,grupoeoração).Nasegundafase, foram investigadas as mudanças na tradução (CATFORD, [1965] 1978) nocotexto dos elementos de convencionalidade destacados na primeira fase. AmetodologiadeinvestigaçãoadotadaseguiuospreceitospostuladospelaLinguísticadeCorpusecompreendeucompilação,preparação,alinhamentoeetiquetagemdostextosparaposterioranálisecomoauxíliodoprogramaWordSmithTools©6.0.Osresultados alcançados apontaram que o estudo da convencionalidade estárelacionado ao uso criativo da linguagem pelo tradutor e, ainda, que suainvestigaçãopodefornecersubsídiostantoparaaelaboraçãodoperfilestilísticodetradutores individuais quanto para a identificaçãodo estilo do texto traduzido. Ascaracterísticassingularesdocorpusdeestudocompiladoparaapresentepesquisapermitiram separar a voz do tradutor da voz dos autores dos textos-fonte epossibilitaramtambémidentificarpreferênciaslinguísticasdessetradutorpresentestanto nos seus textos traduzidos quanto nos seus textos não traduzidos. OsresultadosindicaramqueBrittofezumconjuntodeescolhasdistintoparaostextostraduzidos de cada autor do corpus, sendo influenciado, embora não demaneiradeterminante, pelo estilo dos autores dos textos-fonte. Em geral, as escolhaslinguísticas de Britto em relação ao emprego de expressões convencionaisaumentaram o grau de coloquialidade dos textos traduzidos quando comparadosaosseusrespectivostextos-fonte.Opadrãodeescolhasidentificadonosseustextosnão traduzidos dialoga com o padrão de escolhas identificado nos seus textostraduzidos,emparticular como conjuntode textos traduzidosapartirdaobradePhilipRoth.Amudançanatraduçãomaisfrequentefoioacréscimo(subcategoriadaamplificação).Essasinstânciasdeacréscimonãoestavamdiretamenterelacionadasà explicitação, mas sim à inserção de expressões convencionais típicas da línguaportuguesa,sobretudoquandonãohaviamotivaçãoclaraparaissonostextos-fonte.Britto fez uso ainda do recurso de sanitização, apagando algumas referênciasculturais presentes nos textos-fonte. Entretanto, o número de ocorrências de usocriativo da linguagem realizadas pelo tradutor superou o uso de sanitização,corroborandoosdadosdeMunday (2008)e refutando, até certoponto,oque foi

44

postulado por Baker (1999, 2000). O presente trabalho oferece, dessa forma,informaçõessobreopapeldaspreferênciaslinguísticasdotradutornasescolhasqueele faz para a realização de significado nos textos traduzidos e, portanto, ofereceinformaçõestambémsobreomundoqueotradutorescolheurecriarparaoleitordalíngua-alvo, discutindo as fronteiras entre reconstrução de significados,naturalidade,fluênciaeprecisãonotextotraduzido.

45

Resumos para Pôster

46

6

REARRANGEMENT AND CREATION OF NEW CORPORA FOR UPDATEAND COMPRESSIVE SUMMARIZATION TASKS FOR PORTUGUESELANGUAGE

FernandoAntônioAsevedoNóbregaeThiagoAlexandreSalgueiroPardo

[email protected],[email protected]

WeintroduceinthispapertwocorporafornewsummarizationtasksforPortugueselanguage. We report (i) the rearrangement of an existent multi-documentsummarizationcorpusinordertobeusedforupdatesummarizationand(ii)thecre-ationofacorpusfortrainingcompressivesummarizationmethods.

7

PARA A SEGMENTAÇÃO AUTOMÁTICA DE FRONTEIRA NA FALAESPONTÂNEAAPARTIRDEPARÂMETROSPROSÓDICOS

BárbaraFalcão,PlínioA.BarbosaeTommasoRaso

DepartamentodeLinguística,FaculdadedeLetras–UniversidadeFederaldeMinasGerais,UFMG,Belo Horizonte, Brasil; Departamento de Linguística, Instituto de Estudos da Linguagem,UniversidadeEstadualdeCampinas,UNICAMP,Campinas,Brasil

[email protected],[email protected]

OtrabalhoutilizadadosdecorporadefalaespontâneapararealizaçãodeumscriptdoPraatparadetecçãoautomáticaousemiautomáticade fronteirasprosódicas.Oscript contribuirá aomelhor entendimentoda segmentaçãoda fala, porqueutilizacomo critério de referência para a detecção automática dessas fronteiras osparâmetrosacústicosassociadosàpercepçãohumana.Oscripttambémauxiliaránacompilação de corpora de fala espontânea, porque poderá tornar o processo desegmentaçãodafalamaisrápido,poupando-sesimultaneamentetempoeesforçoshumanos,oquepodeservistocomoumacontribuiçãoparaalinguísticadecorpusemgeral.

12

THE USE OF CORPUS LINGUISTICS IN TEACHING ENGLISH FORACADEMICPURPOSES

FabianaKlein

InstitutodeLetras–UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

This paper aims to analyze the effectiveness of different corpus-based activitiesrelatedtotheprocessofwritingabstractsforacademicpapersbybasiclevelEnglish

47

studentsinaBrazilianpublicuniversity.Thestudywasconductedduringtheyearof2016withtwobasiclevelEAPgroupsfromtheprojectcalledIdiomassemFronteiras(LanguageswithoutBorders).Allthecoursesfromtheprojectareofferedforfreetothe academic community and aim at helping students of English as a ForeignLanguage(EFL)intheirinternationalizationprocess,inordertospreadtheBrazilianresearch throughout the academic world as a whole. This was done, firstly, bydescribing the development of different activities using corpora (compiled withacademicpapersfromthestudents’areasofstudyintheonlinewidelyavailabletextanalysis tool calledVoyant (https://voyant-tools.org/) and theperformanceof twodifferent groups of students who would taking the same course: “English forAcademicPurposes:Abstract andArticleReview”. The first groupof studentswhohad their writing productions analyzed did not use corpus-based materials whilewritingandrewritingtheirabstracts.Theyconstitutedthecontrolgroup.Theirdatawas compared with the performance of a group students who have used lexicalbundlesandcorporaconsultationwhilewritingandrewritingtheirabstracts,duringthesameamountoftimeandsamestructureofclasses.Allthestudentswhowroteabstractsinthisprocessweremaster’sstudentsatUFRGS(FederalUniversityofRioGrande do Sul) and were placed as A2 level students in the Common EuropeanFramework of Reference for Languages. Although taking in consideration that theresultsofthestudymaybeinfluencedbythesmallnumberofparticipantsandthecognitive and personal differences between students, the results show that usingcorpora can increase the quality of their academic writing without necessarilyrepressingtheircreativity. Inaddition, it isstatedthatusingtheseresources intheclassroomrequirestheteachertoadaptactivitiesinordertostimulatethestudents’autonomy (when searching for information on the academic writing from theirfields)andcreativity(whenwritingtheirownpapers).Itisimportanttoconsiderthatthetraditionalmethodsoflearningandteachinglanguagesusuallyfollowthemodelof studying grammar rules and seeing examples only after that. As corpus-basedmaterialsandactivitiesdemandthestudenttodealfirstwiththecurrentexamplesofhowtoconveysometypeofinformation,theteachermustbewillingtoproposediscussions and activities that aim to sharpen the group’s abilities when workingwith written comprehension and production. This can be done even with non-academic texts, for a start, but it is important to engage the group in every classattempts on improving writing creatively. Coupled with these considerations, thestudyallowedtheteachertonoticethatthestudentswhousedcorporaconsultationhadfewerdifficultiesinusingthecorrectprepositionsandcollocationsinsentences,sinceusingcorporaallowedthemtoanalyzethemainphrasesandcombinationofwords through their texts. This study may demand, in the future, more specificresearchonhowtocreateandadaptnewcorpus-basedmaterialsandmethodsandhowtoteachstudentstocompileandusecorporaindependently.

48

14

OS VERBOS DO DISCURSO ACADÊMICO ESCRITO EMUM CORPUS DEAPRENDIZESDEINGLÊS

AnnallenadeSouzaGuedesUniversidadeFederaldeMinasGerais(UFMG)/IFBA

[email protected]

Estudos com corpora de aprendizes (HUNSTON, 2002) têm contribuído para apesquisanaáreadeensinoeaprendizagemdelínguaadicional,principalmente,pelautilização de abordagens de análise linguística, tal como a Análise Contrastiva deInterlíngua (ACI) (GRANGER, 1996) que, dentre outros objetivos, busca compararproduções escritas de aprendizes a corpora de falantes nativos. Considerando osprincípios da ACI, essa pesquisa de doutoramento tem como propósito analisar afrequênciaeospadrõesdeusodoquechamamosde‘verbosdodiscursoacadêmicoescrito’ (VDAEs)em inglês,ouseja,verbosmais típicosnocontextodasproduçõesescritasdaacademia,nogêneroredaçãoargumentativa.Nessesentido,analisamosum corpus de aprendizes de inglês, o CorIFA (Corpus do Inglês para FinsAcadêmicos), compilado na Universidade Federal de Minas Gerais desde 2013 e,utilizamos como corpusde referência, oMICUSP (Michigan Corpus of Upper-LevelStudent Papers), compilado na Universidade de Michigan, nos Estados Unidos.Decorrente desse objetivo central, este estudo se propõe, ainda, a analisar ascolocações mais frequentes que coocorrem com tais verbos. Como nos lembraSinclair (1991), o significado de uma palavra bem como seus padrões léxico-gramaticaissãointerrelacionados,oquenoslevaaperceberqueocontextodeusono qual a palavra se insere nos ajuda a compreender as características distintivasentre as escolhas linguísticas dos aprendizes e de usuários mais proficientes dalíngua.Paraaobtençãodosdados,tomamoscomobaseosseguintesprocedimentosmetodológicos.Primeiro,geramosalistadepalavrasdoCorIFA,atravésdoprogramaAntConc3.2.4eusamosoanotadorClaws7,afimdeidentificarmososverbosmaisfrequentesdocorpus,considerandoopontodecortedefrequênciade20por100milpalavras (CORTES,2008).Emseguida,buscamosquaisverbos, tidoscomomaisfrequentesnoCorIFA,compõemaNewAcademicVocabularyList(AVL)(GARDNER;DAVIES, 2013). Feito isso, comparamos a frequência e o uso desses verbos, bemcomo suas colocações com os dados encontrados nas redações argumentativas doMICUSP.Osresultadosparciaisnosmostramquehápoucavariaçãolexicalegramaticalnos textos do CorIFA, principalmente, no que diz respeito ao uso dos verbos. Ainda,tendoemvistaasanálisesparciaisdeusodosVDAEsesuascolocaçõespelosaprendizes,verificamos que, esta pesquisa, confirma estudos anteriores (GRANGER, 1998;NESSELHAUF,2004),nosquaisaprendizesdeinglêscomolínguaadicionaltendemausarcompoucafrequênciaosverbosmaistípicosdodiscursoacadêmicodefalantesnativos.Podemoscitar, comoexemplo, ‘develop’ (143,13)e ‘improve’(135,56), comoosverbosdemaiorfrequêncianormalizadanoCorIFA.Alémdisso,observamosqueosaprendizestêmdificuldadesaofazerascombinaçõesfraseológicascomessesverbos,muitasvezes,dando preferência àqueles de alta frequência. Observando o uso do verbo depend,encontramosmuitas ocorrências da colocação ‘depend of’(em detrimento de ‘depend

49

on’),noCorIFA,aopassoquenãoencontramosnenhumaocorrênciadestacolocaçãonoMICUSP. Esse fenômeno pode se justificar pela influência da L1 do aprendiz na suaescrita e, mais especificamente, nos padrões colocacionais do inglês. Desse modo,podemos dizer que há entre os aprendizes pouca familiaridade com as fraseologiasprópriasdodiscursoacadêmicoescrito,necessáriasàproduçãodetextosemcontextosuniversitários. Pensando nos resultados que obtivemos até então, acreditamos quenossa pesquisa possa oferecer importantes contribuições para o ensino, maisparticularmente, de inglês como língua adicional, na medida em que evidenciam asdificuldadesencontradaspelosaprendizesequesão,muitasvezes,desconhecidaspelosseusprofessores.Assim,propomosacriaçãodeumalistaoumaterialdeconsultasobreos VDAEs com suas colocações mais frequentes, no intuito de auxiliar os estudantesuniversitários,aprendizesdeinglês,nasescolhaslexicaisegramaticais,quesejammaisapropriadasecondizentescomousodalínguacirculantenodiscursoacadêmicoescrito.Portanto,opresenteestudoconstituiumpasso importante justamenteporqueapontavários aspectos que distinguem o corpus de aprendizes do corpus de usuáriosproficientes quanto ao uso dos verbos típicos do discurso acadêmico. Aomostrarmoscomo esses usos se efetivam na escrita dos aprendizes, estamos em vias de melhorcompreender os textos que produzem e, dessa forma, pensar em como podemosauxiliá-losnatarefadechamarasuaatençãoparaconhecereentendercomooperamosusoslexicaisegramaticaisdoinglês.Nessaperspectiva,defendemosser importanteinvestigar os verbos do discurso acadêmico escrito, no sentido de podermos tersubsídios que melhor caracterizem seu uso e, assim, contribuirmos para preencherlacunasquantoaosestudossobreescritaacadêmica,principalmentenoquedizrespeitoaostextosproduzidoseminglês,direcionadosaumpúblicoespecíficoemotivadosporpropósitosdiversos,nointuitodeatenderadiferentesdemandasacadêmicas.

18

ANOTÍCIAPOLICIALNAMIRADALINGUÍSTICADECORPUS

JoacyrOliveira

UniversidadedeSãoPaulo(USP)/UniversidadeEstadualdeCampinas(UNICAMP)

[email protected]

ApesquisaaquiapresentadaéumensaioparademonstraraaplicaçãodaLinguísticade Corpus como uma ferramenta de facilitação e de estatística em análisespropostaspelaAnálisedoDiscursoCrítica(ADC).Paratanto,ocuparemo-nos,dentrodo gênero jornalístico informativo, de notícias policiais. É notório que a imprensa,escritaoufalada,diligenciaser isenta– imparcialemrelaçãoaosfatosquenoticia.Até que ponto e grau, essa imparcialidade é, de fato, atingida? Como objeto deestudo desta investigação, escolhemos a divulgação do assassinato de MérciaNakashima,ocorridoem23demaiode2010.Oassassino,julgadoecondenadoemagostode2013,foiseuex-namorado,MizaelBispodeSouza.Aescolhadessecrimese deve ao fato de tanto a vítima quanto o homicida terem a mesma profissão:advogado. Há um terceiro personagem: o cúmplice Evandro Bezerra da Silva, orareferidocomovigia,oracomovigilante.Ocorpusécompostopor94textos,sendo47artigosdojornalOEstadodeSãoPauloe47artigosdojornalFolhadeSãoPaulo,publicadosdodia23demaiode2010a27deagostode2010,ummêsapósajustiça

50

ter pedido a prisão preventiva de Mizael Bispo. O corpus totaliza 3.551 types e40.222 tokens. A pergunta que norteia a pesquisa é se os textos das matériaspublicadasassociamosnomesdavítimaedoassassinoàprofissãodeadvogadoedocúmpliceàprofissãodevigiadamesmaforma.Dadosfundamentadosnaanálisedocorpusdemonstramque, na verdade, cadaumdosenvolvidosé tratadode formadistinta. Iniciamos nossas análises a partir da lista de palavras-chave utilizando aabordagem corpus-driven. Os cinco termos com maior índice de chavicidade efrequência sãoMizael (613ocorrências),Mércia (447),advogado (239),Nakashima(185) e advogada 190. A princípio, parece que as profissões são associadas aosenvolvidos de forma igual. Entretanto, a análise dos colocados e das linhas deconcordância com os termos “advogada” e “advogado” revelaram um dadoinesperado. Enquanto “advogada” se coloca com “Mércia” 59 vezes, em todas asoutras ocorrências o termo é usado de formapronominal, ou seja, substituindo onomedavítima.Jáotermo“advogado”secoloca37vezescom“Mizael”eapenasumavezéusadodeformapronominal.Emtodasasoutrasocorrências,otermoéusado para se referir aos advogados envolvidos profissionalmente no caso. Nestaconjunturadapesquisa,podemosconcluirque,enquantoavítimaéconstantementeassociada à sua profissão, o assassino é referido por seu nome ou sobrenome oucomo“ex-namorado”(63ocorrências).Taisaspectosdasnotíciaspodemlevarleitora “desassociar” o assassino da profissão de advogado. Durante nossa exposição,apresentaremos a lista de palavras, a lista de palavras-chave, e as linhas deconcordância para “Mizael”, “Mércia”, “advogada”, “advogado”, e incluiremos osresultadosdaspesquisascomonomeeprofissãodocúmplicedocrime:“Evandro”e“vigia”.“Evandro”apareceem11olugarcom119ocorrênciase“vigia”+“vigilante”em23olugarcom84ocorrências.

20

GRAMÁTICA LIVRE DE CONTEXTO LEXICALIZADA E A LINGUAGEMRADIOLÓGICA

CinthyanRenataSachsC.deBarbosa,DavidsonCuryeEdioRobertoManfio

DepartamentodeComputação–UniversidadeEstadualdeLondrina(UEL);InstitutodeInformática–UniversidadeFederaldoEspírito Santo (UFES); FaculdadedeTecnologiaDeputado Júlio JulinhoMarcondesdeMoura(FATEC)

[email protected];[email protected];[email protected]

Este trabalhoapresentaumanovaabordagemàGramáticadaLínguaNaturalparadescrição do português através de um sistema de geração de árvores, chamadoGramática Livre de Contexto Lexicalizada (GLCL), a qual foi testada utilizando umsubconjunto da linguagem radiológica, onde foi possível validar um diagnósticomédico.

51

25

OVOCABULÁRIODEPRIDEANDPREJUDICEESUATRADUÇÃOPARAOPORTUGUÊS:UMAANÁLISELEXICOESTATÍSTICA

LaísCallegaroFritzeneLuísaBranchiAraújo

UniversidadeFederaldoRioGrandedoSul

[email protected];[email protected]

Esteartigoapresentaaanálise lexicalcomparativadePrideandPrejudice,de JaneAusten,eumadesuastraduçõesparaoportuguêsbrasileiro.Oobjetivofoiestudaracomplexidadelexicalpormeiodalexicoestatística,àluzdosestudosdaLinguísticadeCorpus.Fez-seo levantamentodo léxicocomoAntConc3.4,emcotejocomoscorpora de referência – Corpus of Contemporary American English e ProjetoPorPopular – e comparou-se os níveis de complexidade lexical com oAntWordprofiler. Constatou-se que a lexicoestatística serve aos estudos decomplexidade lexicaletextualaoauxiliaropesquisadoraexploraro léxicoemseuusoreal.Aopropiciara identificaçãodopúblico leitor,contribuiaindaaosestudosdegênerotextualedetradução.

26

TICAL:UMCHATBOTQUEVERSASOBREASSUNTOSLINGUÍSTICOS

FábioCarlosMoreno,EdioRobertoManfioeCinthyanR.SachsC.deBarbosa

DepartamentodeComputação–UniversidadeEstadualdeLondrina(UEL);FaculdadedeTecnologiaDeputadoJúlioJulinhoMarcondesdeMoura(FATEC)

[email protected];[email protected];[email protected]

EsteartigoabordaaconstruçãodeléxicosdigitaisnoâmbitodoProcessamentodeLínguaNatural(PLN).SerádescritoaseguirumrobôdeconversaçãochamadoTICALqueversasobreoALiB(AtlasLinguísticodoParaná)etemaumentadoseudomíniopara o Léxico Histórico do Paraná (LHIsPAR) que também constitui-se história doPortuguêsBrasileiro.

29

VOCABULÁRIOS MONOLÍNGUES DE TERMOS DA TEOLOGIA: ESTUDOCONDUZIDOPORCORPUS

SolangeCardoso

UniversidadeFederaldeUberlândia(UFU)

[email protected]

EstetrabalhoobjetivaaelaboraçãodetrêspropostasdevocabuláriosterminológicosdaáreadeTeologiaqueusaráaferramentadoVocabulárioTécnicoOnline–VoTec

52

(FROMM, 2007) que pode ser visualizada, gratuitamente, em página da Internet(www.pos.voteconline.com.br). As bases teóricas desta pesquisa estão alicerçadasnos conceitos teóricos e metodológicos da Teoria Comunicativa da Terminologia(TCT;CABRÉ,1993;1999);nasconcepçõesdedicionário,vocabulárioeglossáriodeBarbosa (2001); nosestudosdeBarros (2004); Kriegere Finatto (2004)eAlmeida,Pino e Souza (2007) em relação à elaboração das definições dos verbetes; nospressupostos teóricosparao trabalhocomametodologiadaLinguísticadeCorpus(BERBERSARDINHA,2004;TEIXEIRA,2008;SCOTT,2012)enaoperacionalizaçãodaplataformadegestãoterminológicaVoTec(FROMM,2007).Oscorporatextuais,queserviram à extração das Unidades Terminológicas e à elaboração da proposta devocabulários, foram constituídos de textos escritos e digitalizados utilizados pelosalunos, professores e formadores nas aulas e nos encontrosde evangelização daFaculdadeShalomdeEnsinoSuperior(Fases)edaFaculdadeCatólicadeUberlândia(FCU). Consideramos que este estudo se justifica pelo fato de que os dicionáriosrepresentam hoje uma ferramenta de grande importância no processo deensino/aprendizagem das diferentes áreas do conhecimento humano e, nessesentido, a reflexão sobre a Terminografia e a preocupação com a elaboração dedicionários para aprendizes têm crescido ultimamente. Além disso, este trabalhocontribuirá para a criação de vocabulários com verbetes cuja construção dasmicroestruturasserábaseadaemdadoscoletadospormeiodecorporaespecíficos.Assim, as definições (microestruturas) serão construídas unicamente por meio deexemplos tirados dos corpora por nós compilados. Procederemos assim porque,raramente, produtos terminográficos são criados a partir do perfil e dasnecessidades dos aprendizes de uma área de especialidade em determinadasituação comunicativa. Ou seja, raras são as obras elaboradas para um públicoconstituídoporaquelesqueaindaseencontramemumperíododeformação,sejaela técnicaouacadêmica.Comoministramosaulasde línguaportuguesaemcursode Bacharel em Teologia, temos presenciado a dificuldade de estudantesuniversitáriosparaacompreensãodetextos,cujaáreaespecializadaéaTeologia.Adificuldade não é superada ainda que esses estudantes sejam levados a consultarobras lexicográficas do tipo: dicionário secular, dicionário bíblico, chave (oureferência) bíblica, livro de geografia bíblica e ou enciclopédia bíblica. Isso nosremete principalmente à questão da eficiência dessas obras no que se refere aoauxílio das aprendizagens no campo das ciências teológicas (principalmente, dealunosnosanosiniciaisdessasaprendizagens).Estapropostadetrabalhopretende,então,serumacontribuiçãoparaaelaboraçãodedicionáriomonolínguedetermosda Teologia, tendo como ponto de partida a compilação de corpora a partir dasbibliografias indicadasnasementaseoutras sugeridaspelosprofessoresdecursosde Teologia. A elaboração deste trabalho se justifica também, pelo fato de haverdiferentes denominações cristãs, cuja distinção, certamente, fixa-se por meio deconceitos que estabelecem o cerne de formação teológica desenvolvida,particularmente,emcadaumadessasdenominações.Asetapasmetodológicasqueseguimos estão assim organizadas: i) elaborar Árvores de Domínio da área deTeologiadas instituiçõesComunidadeShalome IgrejaCatólicaApostólicaRomana,conformeaorientaçãoteológicadasfaculdadespesquisadas;ii)selecionar,coletareorganizar os corpora de estudo; iii) elencar candidatos a termos que possam serincorporados aos vocabulários; iv) analisar, contrastivamente, os vocabulários das

53

duas faculdades para a geração do terceiro vocabulário; e v) inserir os dados naplataformadegestãoterminológicadoVoTec.Esclarecemosqueestetrabalhoaindanão foi finalizado, apresentamos assim, a organização e análise dos corpora depesquisa:etapasi)eii).ElaboramosaÁrvoredeDomíniodagrandeáreadaTeologiapesquisando o sítio virtual do Conselho Nacional de Desenvolvimento Científico eTecnológico(CNPq)eosítiovirtualdaCoordenaçãodeAperfeiçoamentodePessoaldeNível Superior (CAPES). Pormeioda consulta adocumentoseespecialistasdasduas faculdades, elaboramos as árvores de domínio dos cursos de Teologia.Iniciamos a organização dos corpora compilando livros indicados pelos alunos deuma das faculdades. Esclarecemos que essa indicação teve a devida anuência dosprofessores. A seguir, fizemos inúmeras incursões a diferentes sítios virtuais. Paraessas incursões, usamos as áreas e subáreas (Árvore de domínio) como palavras-chave de busca. A composição do corpus reuniu: apostilas elaboradas porprofessores, livros-texto,manuaisdeTeologia,entrevistascomestudiososdaárea,sermões,encíclicasetc.Alémdoslivrosdeindicaçãodosalunos,todoomaterialfoireunido por meio de consultas a sítios devocionais católicos e evangélicos.Consultamostambémecoletamosmaterialemdiferentessítiosdecursossuperiorde Teologia da modalidade a distância (EaD). Localizados os textos, esses eramselecionadoseinseridosemarquivosdoWordparaarealizaçãoderevisãovistoque,no processo de seleção, cópia e colagem dos textos, caso houvesse erros, essesseriam visualizados. Após essa etapa, foram inseridos cabeçalhos contendo asinformações mais gerais pertinentes a cada texto: título e autoria (quandolocalizada) e os arquivos foram salvos em txt. No final do texto, inserimos local(endereçovirtual)edatadecoleta.Criamoscódigosparaanomeaçãodosarquivosusandoa letra inicialde cadapalavrado títulodo texto, seguidadas letras iniciaisdassubáreaseáreasdaTeologia.Otítulo,asubáreaeaáreaforamseparadosporhífen.Reunimostodosostextosemdoisgrandesarquivos:noprimeiro,ostextosdaFCUenosegundo,ostextosdaFases.Comoferramentadeanáliselexical,utilizamoso WordSmith Tool (WST) que permite, dentre outras funções, gerar listas depalavras, palavras-chave e concordâncias. Para gerar as listas de palavras-chave,comparamos a frequência das palavras dos corpora de estudo com o corpus dereferência do Banco de Português (BP). Para a inserção na plataforma do Votec,estabelecemos os critérios de escolha dos candidatos a termos. Assim, i)selecionamos45candidatosa termosentreos100primeiros itensmaischaves; ii)selecionamos, por relação lógica, o termo contido na definição de outro cujacompreensão é fundamental para o entendimento do termo definido. Assim, taltermo também será definido e será remissivo. Por exemplo, “Deus é a TrindadeSanta”;otermoTrindadedeveráserdefinidoeseráremissivoaotermo“Deus”;iii)preferencialmente,serãodefinidosostermoscorrespondentesentreosdoiscorporadeestudo,poisoobjetivoérealizarumaanálisecontrastivadessestermos;iv)apósa aplicação do terceiro critério, não satisfeita a prerrogativa de se encontrar umcandidatoatermocorrespondente,nocorpusemcontraste,foramconsideradosostermoscomaltachavicidadeerelevâncialógicadentrodocampodoconhecimentoteológico católico e do conhecimento teológico evangélico. Por exemplo, o termoEucaristiaestápresentenoCCenãoaparecenoCE.Aescolhadessestermos,nessequartonível,possibilitaráacomparaçãoemsegundainstância,ouseja,poderemosdetectar/analisar não o contraste do conteúdo da definição dos termos, mas

54

também, a diferença de termos mais ou menos relevantes entre as duas linhasteológicas; v) quando se tratava de um candidato a termo que fosse composto,embora aparecesse isoladamente na lista de palavras-chave e fazia sentidoseparado,comoporexemplo,Jesus(emJesusCristo)eEspírito(emEspíritoSanto),optamos por definir o termo composto. Para isso, alguns procedimentos foramnecessáriosafimdegeraraslinhasdeconcordânciasdotermocomposto.Passamosentão a descrever os procedimentos a serem executados. O primeiro passo foilocalizarapalavraprincipalouprimeiraàesquerdadotermocomposto(Jesus,porexemplo). Em seguida, gerar a linha de concordância daquele termo e salvá-la. Oterceiropassofoiabrirafunção“collocates”eencontraro“colocado”comotermocomposto (Cristo). O WST disponibiliza a quantidade de colocados com o itemdesejado,clicamossobreeleparaabriras linhasdeconcordânciascomocolocadodesejado (Jesus Cristo). Assim, pudemos localizar as linhas que tivessem possíveiscontextos definitórios e/ou explicativos, que permitissem a elaboração dasdefinições; vi) outro procedimento a ser adotado para a localização de contextoseficientesparaacriaçãodadefiniçãofoiautilizaçãodafunçãoclustersjáinseridonatela de concordância do colocado, “em processo de escolha para ser um termodefinido”. Pretendemos que o produto final seja um instrumento que facilite acompreensão de conteúdos/textos objetos de estudo das aulas ministradas porprofessoresdosanos iniciaisdecursosdeTeologia.Nossodesafioé,pormeiodostextosqueconstituirãooscorporadestapesquisa,elencarostermoseasdefiniçõesque, provavelmente, constituem a visão do conhecimento acadêmico teológicodifundido pela Faculdade Católica de Uberlândia (Vocabulário dos termos daTeologia–FaculdadeCatólicadeUberlândia)epelaFases(VocabuláriodostermosdaTeologia–Fases).Oterceirodicionário(Vocabulárioostermosemcontraste)seráo resultado do confronto entre termos idênticos utilizados nos dois outrosvocabulários.

31

TERMINOGRAFIA DIDÁTICO-PEDAGÓGICA: METODOLOGIA PARAAPOIO À LEITURA EM INGLÊS DE TEXTOS DEELETROTÉCNICA/ENGENHARIAELÉTRICA

SabrinaBonquevesFadanelli UniversidadeFederaldoRioGrandedoSul(UFRGS)/UniversidadedeCaxiasdoSul(UCS)

[email protected]

A motivação para esta pesquisa nasceu no período em que iniciei meu trabalhocomo docente na disciplina de Inglês Instrumental para cursos técnicos deEletrotécnicaecursosdegraduaçãoemEngenhariaElétrica.AEletrotécnicaéumaárea da Engenharia Elétrica que lida com instalações de redes elétricas,transformadores, circuitos elétricos residenciais, industriais, etc. A principalnecessidade desse público-alvo para a realização de seu trabalho é a leitura dedocumentos técnicos chamados datasheets, que contêm especificações sobre ofuncionamento de dispositivos elétricos (DEWEY 1998). Esses documentos seencontramemsuamaioriaescritosemLínguaInglesa.Apesquisapartedapremissa

55

dequeoprotótipodeglossáriodeveserdesenvolvidoapartirdepreceitosdeumametodologia que chamamos Terminografia Didático-Pedagógica, práticaterminográfica baseada na triangulação entre preceitos da Teoria da Terminologiade perspectiva Textual (CIASPUCIO 1998, 2003; FINATTO 2004; KRIEGER 2004;BOURIGAULT E SLODZIAN 2004); da Teoria Sócio-Cognitiva da Terminologia(TEMMERMANN 1997, 2000, 2004); e da Linguística de Corpus (BIBER 1988;SINCLAIR1991;BERBER-SARDINHA2004).ATerminografiaDidático-Pedagógica(TD-P) combina dados extraídos de gêneros textuais (SWALES 1990; BAZERMAN2005)relevantes ao ambiente de ensino com dados obtidos em coleta de dadosdiretamente com os participantes desse ambiente. O usuário direto dessametodologia deve ser o professor/pesquisador de ESP e/ou o pesquisador deTerminografia/Terminologia, pois a utilizará para produzirmateriais e ferramentasque o auxiliem em seu trabalho em sala de aula. O usuário indireto dessametodologia será o aprendiz da área técnica comdiferentes níveis de proficiênciaemLínguaInglesa.Metodologia:Passo1:observaredetectarasdificuldadescomovocabulárioeemrelaçãoà leituradosdatasheetsnoambientedeensino;Passo2:coletardadosdogênerotextualescolhido,nocasoosdatasheets; Passo3:coletardados com os alunos; Passo 4: comparação dos dados de acordo com critériosestabelecidosnaobservaçãodasdificuldades;Passo5:montagemdoprotótipodeacordocomdadosextraídosdacomparação.Atravésdosresultados,concluímosquea combinação de dados proposta pela metodologia da Terminografia Didático-Pedagógica pode auxiliar na montagem de uma ferramenta mais direcionada aopúblico-alvo que a utilizará algum dia, justamente porque resultou em dadosdiversos do que uma pesquisa exclusivamente com ferramentas que realizam aseleçãodecandidatosatermospoderiafornecer.

35

CONSTRUÇÕES DE TÓPICO NO PORTUGUÊS FALADO EM ÁREASINDÍGENAS-

WliannaSilvadeAraújoeEdivaldaAlvesAraújo

UniversidadeFederaldaBahia(UFBA)

[email protected];[email protected]

Esse trabalho tem comoobjetivo identificar a realizaçãode construções de tópicoemdadosoraisdoportuguêsfaladoemáreasindígenasbrasileiras,comaintençãode levantar a frequência dessas construções e suas características sintáticas,trazendo mais contribuições para os trabalhos nessa área. A análise aquiapresentadatemaporteteóricoemPontes(1987)eOMITIDO(2006),emrelaçãoàsconstruções de tópico, e outros autores, como: Decat (1989), Galves (2001) eOMITIDO(2009a,2009b),emrelaçãoaoportuguêsbrasileiro.

56

36

OOBJETODIRETOEMCONSTRUÇÕESDETÓPICODOSÉCULOXIX

CristovãoMascarenhasCordeiroeEdivaldaAlvesAraújo

UniversidadeFederaldaBahia(UFBA)

[email protected];[email protected]

Muitospesquisadores têm sededicadoaestudos voltadospara as construçõesdetópiconoportuguêsbrasileiro(PB).Entreesseslinguistas,destaca-seEunicePontes(1987),cujostrabalhostêmdesencadeadodiscussõesacercadaconstruçãosintáticadessalíngua,apartirdahipótesedequeoPBestariasedefinindocomoumalínguacomproeminênciadetópico(elementosdeslocadosàesquerdadaoração).SegundoPontes(1987),quandosecomeçaaobservara línguacoloquialespontâneanousodiário, fica-se surpreso com a quantidade de vezes em que ocorrem construçõescomtópico.Comestetrabalho,buscamosrastreardiacronicamenteasconstruçõesde tópiconoPBpara identificar se sãoprodutivas a pontode caracterizá-lo comoumalínguadeproeminênciadetópicojáemperíodospretéritos(séculoXIX)equaisos fatos sintáticos que podem ser identificados nessas construções. A partir daproblematizaçãoproposta,levanta-seahipótesedeque,parasedesenvolvercomolínguacomproeminênciade tópico,oPB jáapresentavaessa tendênciaemtextosproduzidos em séculos anteriores, comoo XIX, por exemplo. Assim, esta pesquisaobjetiva analisar construções sintáticas doPBdos séculos XIX a XXI, envolvendoodeslocamento do objeto direto para a posição de tópico, para identificar ascaracterísticaseoscontextosdeocorrênciadessasconstruções.Éimportantequeoconceito de tópico seja minimamente esclarecido para o entendimento de nossapesquisa. De forma breve, podemos dizer que a definição de tópico pode serestabelecida a partir de dois grandes grupos de características: sintáticas esemânticas.Noque tangea sintaxe,está relacionadaàordememqueaspalavrascompõem o discurso: é o elemento deslocado à esquerda na oração. A sintaxe éresponsávelporoferecerolocalparaotópicoacontecer;asemântica,porsuavez,restringeoSN,nãoéqualquerSNquepodeserconsideradotópico,massimaquelesque possuem os traços: (+ definido); (+específico); (+ identificável); (+ ativo) (cf.Araújo, 2006). Dessa forma, o tópico (elemento deslocado à esquerda), sob aperspectiva semântica, possui características como: referencialidade,identificabilidade,definitudeetc.Paraaprimeirapartedesseestudo,optou-seporobservarobrasdoséculoXIX.Entreessas,foramanalisadasalgumaspeçasdeteatro:“O noviço”, Martins Pena (1845), “As desgraças de uma criança”, Martins Pena(1846);“Caiuomistério”,FrançaJúnior(1883);osromances“OCortiço”(1890),deAluísio de Azevedo; “Triste fim de Policarpo Quaresma” (1915), de Lima Barreto;“QuincasBorba”(1881)e“DomCasmurro”(1899),deMachadodeAssis(1891);trêscontosdessemesmoautor: “Teoriadomedalhão” (1881); “ACartomante” (1884);“MissadoGalo”(1893).EscolhemososéculoXIX,poisesseperíodorefleteocaráterintermediário do fenômeno relacionado ao ordenamento dos constituintes nasentença. Segundo Tarallo (1996), é a partir do século XIX que o processo deformalizaçãodofenômenoseintensificaeamudançaemrelaçãoao“enrijecimento”daordemSVOseconcretiza;éaindanesseperíodoqueumagramáticadoportuguês

57

brasileiro começa a ser delineada, uma gramática independente da gramática dePortugal.OséculoXIXé,portanto,omarcoinicialdesumarelevânciaparaonossotrabalho. A partir da análise dos dados, objetivou-se verificar as construçõesexistentes e as diferenças ou semelhanças entre elas para, hipoteticamente,capturarascaracterísticassintáticasdasconstruçõesdetópicoenvolvendoaposiçãode objeto direto nesse período, bem como avaliar a classificação do portuguêsbrasileiro como língua direcionada para o discurso. Curiosamente, os autoresanalisados não apresentaram em seus textos construções de tópico como asapresentadas por Pontes (1987) ou envolvendo o objeto direto, à exceção deMartinsPena.Ostextosdesteautorsãoconsideradosdecunhomaispopularedelinguagem espontânea, contexto considerado favorável para as construções detópico.Naverdade,aanálisedosseustextosdemonstraqueoautoreraformalemsuas construções. Talvez a sua irreverência estivesse na abordagem de algunsassuntos ou de temas, considerados tabus ou polêmicos para a época. As suasconstruções sintáticas, ao contrário, não demonstram irreverência, mas antesconservadorismo. Diferentemente dos outros autores analisados, que nãoapresentaramconstruçõesdetópico,MartinsPenadestaca-seportrazerconstruçãodetópicoenvolvendooobjetodireto:adotipotopicalizaçãoV2,comonoexemplo:“Paciência, preciso eu também ter, e muita.” (MP. O Noviço, 1845). Esse tipo deconstrução, segundo Ribeiro (1996), apresenta como característica principal ainversão na ordemdos constituintes: o verbo ocupa a segunda posição e há umainversãoverbo-sujeito.Sãoconstruções típicasdoportuguêsarcaico,mas,emboracom pouca frequência, foram encontrados resquícios dessas construções noportuguêsbrasileiroqueperduraramatéo iníciodo séculoXX (cf.RIBEIRO,1996).SegundoRibeiro(1996),osujeitopós-verbalpodeserresultantedomovimentodeverboparaCº.Seriaumtipodefrontalizaçãodoverbocomdeslocamentodealgumoutroconstituinteparaaposiçãoinicialdasentença,imediatamenteantesdoverbo,originandoaordemXVouV2, caracterizandona linguísticaoquesedenominade“inversão germânica”. Encontramos esse tipo de inversão nos dados de MartinsPena, o que revela uma singularidade em sua sintaxe, se comparada a de outrosescritores domesmoperíodo.O estudo temnosmostradoque as construções detópico sofrem evolução ao longo da história da língua. São dinâmicas. Ou seja,construções encontradas no século XIX não são encontradas no século XXI e vice-versa. Supomos que as construções de tópico estão de acordo com o percursosintático da língua. As características sintáticas do português brasileiro eramdiferentesnoséculoXIX:haviamaismorfologia,maissujeitonulo,maismovimentodeverbo;consequentemente,erapossívelencontrarconstruçõesdetópicodotipoV2. Com a perda da morfologia, há mudanças sintáticas no PB que envolvemtambémasconstruçõesdetópico,mudandoassuasocorrências.Odesenvolvimentodeste trabalho tem permitido identificar a evolução dessas construções noportuguêsbrasileiro.Espera-se,assim,queosresultadosdessapesquisacontribuampara ampliar as discussões relacionadas aos estudos diacrônicos da sintaxe dessalíngua.

58

49

BRWAC:UMGRANDECORPUSPARAGRANDESDESAFIOS

JorgeAlbertoWagnerFilho,RodrigoWilkenseAlineVillavicencio

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected];[email protected];[email protected]

Corpora de grande volume tornam-se cada vez mais necessários em diferentestarefas de Processamento de Linguagem Natural. Isto levou pesquisadores abuscarem em uma das maiores fontes de conteúdo dos tempos atuais, a Web,materiais para complementar seus repositórios tradicionais. Neste trabalho,apresentamos a construção de um corpus Web de grandes proporções para avariantebrasileiradalínguaportuguesa,visandoatingirumtamanhocomparávelaoestadodaartedeoutros idiomas.O corpusobtidoé compostopor2,7bilhõesdepalavras,efoicompletamenteanotadocomumanalisadorsintático.

50

PLURISIGNIFICAÇÃOEMTRANSITIVIDADE

RodrigoEstevesdeLimaLopes

UniversidadeEstadualdeCampinas(UNICAMP)

[email protected]

EsteartigotemporobjetivodiscutircritériosparaclassificaçãodeprocessosdentrodoescopodaGramática Sistêmico-Funcional, apartir deumaabordagembaseadaem corpus. Argumenta-se que as características semânticas dos processos podemser mapeadas a partir de suas colocações, estabelecendo, assim, padrõesgramaticaisquepoderiamservircomoparâmetrodeanálise.

51

PROPOSTA DE UM CORPUS DO PORTUGUÊS POPULAR BRASILEIROSIMPLESAPARTIRDOPERFILSOCIODEMOGRÁFICODOSLEITORES

BiancaFrancoPasqualini UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

Oobjetivodanossapesquisaéproporumcorpusdoportuguêssimplesbrasileirodeacordocomdadossociodemográficosatuaissobreos leitoresbrasileiros,seuperfilde leitura,escolaridadee interessede leituraquevenhaaservircomomaterialdesubsídioparaestudos futuros.Parasuprirpartedacarênciade recursosem línguaportuguesa do Brasil, este trabalho insere-se nosmarcos da Linguística de Corpus(BERBER SARDINHA, 2004) e descreve uma proposta de corpus de textos em

59

portuguêsbrasileirosimples,levandoemcontacaracterísticasespecíficasdeleitorescom letramento básico, bem como seu perfil de leitura. Tais leitores compõematualmentequasemetadedocontingentedeleitoresnoBrasil,deacordocomdadosrecentes do Indicador de Alfabetismo Funcional (INAF, 2015). Partimos dopressupostodequetextosconsumidosporleitorescombaixoletramentopodemserconsideradostextoscomníveldecomplexidadesuficienteparaessepúblico,mesmoque possam revelar estruturas gramaticais, lexicais e semânticas sofisticadas.Inicialmente, na primeira etapa da pesquisa, levantamos dados sociodemográficossobreosleitoresbrasileiros,talcomorelataapesquisaRetratosdaLeituranoBrasil(AMORIM,2011) e INAF (2016).ApesquisaRetratosda LeituranoBrasil traçaumpanoramabastantecompletodoperfildosleitoresbrasileiros,desdeclassesocialeescolaridade dos leitores até os livrosmais lidos e autores favoritos, além de daralgunsindíciostambémsobreoperfildosnãoleitores.JuntocomosdadosdoINAFde2016,ambasaspesquisasdemonstramqueocontingentedamaioriadosleitoresbrasileirosécompostoporindivíduosentre15e64anos,dasclassesCeD,emnívelbásico de alfabetização, ou seja, com letramento baixo. De posse desses dados,passamos para a segunda etapa, que se constituiu em selecionar textospotencialmente simples de acordo com a lista de livros mais lidos da pesquisaRetratosdaLeituranoBrasiletambémtextosconsumidosporleitoresdasclassesCeD,comotextosliterárioseojornalismopopulardosjornaisDiárioGaúcho,Massa!e Hora de Santa Catarina, como relatam os trabalhos produzidos no âmbito doProjeto PorPopular (FINATTO, 2011 e 2012), projeto em que a nossa pesquisa seinsere.IncluímostambémojornalBocadeRua,produzidoporpessoasemsituaçãode rua na cidade de Porto Alegre e coordenado pela ONG ALICE. A análise dasrespostas ao questionário aplicado na quarta etapa confirma a percepção de umcontinuum de simplicidade-complexidade textual pelos respondentes, o quecorresponde ao que as pesquisas Retratos da Leitura no Brasil e INAF revelam.Oobjetivodanossapesquisaéproporumcorpusdoportuguêssimplesbrasileirodeacordocomdadossociodemográficosatuaissobreos leitoresbrasileiros,seuperfildeleitura,escolaridadeeinteressedeleitura.Issoequivaleadizerquepartimosdopressupostodequetextosconsumidosporleitorescombaixoletramentopodemserconsiderados textos com simplicidade suficiente para esse público, mesmo quepossam revelar estruturas gramaticais, lexicais e semânticas sofisticadas, comoafirmamosanteriormente.Asrespostasaoquestionárioindicamqueháumarelaçãoentreclassesocial,escolaridadeepercepçãodecomplexidade,eestapercepçãodeleitura deve ser levada em conta na confecção do corpus proposto pela nossapesquisa. Acreditamos, com isso, que contribuiremos com um material rico parapesquisas futuras sobre o tema da complexidade e da simplificação textual deacordocomarealidadeatualdasituaçãodosleitoresedaleituranoBrasil.

60

62

O USO DE CORPORA ONLINE MULTIMODAIS PARA ENCONTRAR AEQUIVALÊNCIA DE TERMOS EM INGLÊS TENDO COMO BASE ODICIONÁRIOOLÍMPICO

CarolineCougo

UniversidadedoValedoRiodosSinos(Unisinos)

[email protected]

O presente trabalho visa à análise do trabalho de corpora online realizado parabuscar equivalentes em inglês para termos do português durante a confecção doDicionário Olímpico, o qual foi realizado na UNISINOS pelo grupo Semantec ecoordenadopelaProfa.Dra.RoveChishman.Paracomeçar,éimportanteintroduzireexplicaro funcionamentododicionário,que foi inspiradonos jogosolímpicosde2016, tendocomobase referencial a SemânticadeFrames,deCharles Fillmore.Oautordescreveumframecomo“qualquersistemadeconceitosrelacionadosdetalmaneiraqueparaentenderqualquerumdeleséprecisoentenderaestruturaqueoscomportacomoumtodo”(FILLMORE,1976).Juntamentecomessateoria,trabalha-se com a Lexicografia Computacional e a Linguística de Corpus, que é “umacoletânea de textos naturais (naturally occuring), escolhidos para caracterizar oestadoouvariedadedalinguagem”(SINCLAIRapudSARDINHA,2000,p.16).Estafoiusadaparacoletarequivalenteseminglêseexemplosdeuso,e,para isso,usamosprogramas como AntConc e Sketch Engine. Para fazer uma coleta de unidadeslexicaiseexemplosdeusonessesprogramas,tínhamoscomoprimeiroobjetivofazera coleta de materiais escritos de cada esporte. Primeiramente, deveríamosselecionar links que fossem considerados fontes de dados; a saber, sites sobreesportes, sites de federações, periódicos especializados e manuais. Nós tínhamosdoistiposdecorpora:ocorpusdeconsultaeocorpusdepesquisa.Oprimeiroeraum documento doWord com uma tabela de links que julgávamos como osmaisinformativos,osquaisconsultávamoscadavezquetínhamosalgumadúvidasobreoesportepesquisado.Osegundo,corpusdepesquisa,eracoletadotambémnoWord,porém era um texto corrido, isto é, continha apenas os textos, sem data depostagem, título ou qualquer outra informação que por ventura os circundassem.Assim deveria ser porque esse corpus seria formatado para txt e seria rodado noprograma AntConc. Um fato relevante em relação aos corpora de consulta epesquisaéqueocorpusdeconsultapermitiaqualquertipodetextoquetrouxesseinformaçõesqueopesquisadorachasserelevante,enquantoodepesquisapermitiaapenas textos do tipo match reports – ou seja, notícias que descrevessem aspartidas, como tempoverbalgeralmentenopassado,econtendo termosdecadaesporte. Por exemplo, um corpus de pesquisa relevante do futebol, teria umanarrativa do tipo: “O jogador fez uma bicicleta e chutou em direção ao gol”. Ostermos“bicicleta”e“gol”seriamtermosespecíficosdofuteboleotempoverbalnopassado.Osesportesmaispopulares,comofutebol,vôleiouhandeboldeveriamter,nomínimo 500.000 caracteres, e os menos populares, como esgrima, 150.000. Adificuldadequeencontramos,entretanto,foiqueosesportesmenospopularesnão

61

apresentavam match reports suficientes para preencher o mínimo do corpus depesquisa. O mínimo de 500.000 caracteres para esportes mais populares,entretanto,eramfacilmentepreenchidos.Nomeiodaprodução,então,ogrupodepesquisa e o grupo de tradução desistiram dessa coleta de corpus por meio deprogramase começarama coletarunidades lexicais, traduçãoeexemplodeusoapartirdecorporaonlinemultimodais,comoGoogleNewse Imagens,narrativasdejogos no Youtube e até mesmo o Linguee. A lista de palavras e de coletas deexemploeminglêsnãopassavade200emcadaesporte,e,paracadaumdeles,foiorganizadaumaplanilhanoExcelcomasunidadeslexicaisemportuguês,contendo,ao lado, seu equivalente em inglês. Caso não houvesse um equivalente em inglêsparaumapalavra, umanota ao ladoexplicava seu significado. ForamencontradasequivalenteseminglêsparaagrandemaioriadalistadeULs.Otrabalhodepesquisado grupo de tradução a partir de corpora na web foi realizado por um grupo dequatropessoas eo tempomédiode términodeumaplanilha comequivalentes eexemplos de uso girava em torno de cinco a seis horas, sendo cada pessoaresponsável porumesportede cada vez.Apesquisaera feitanomodelo termoatraduzir+nomedoesporteem inglês.Quandohaviaum termocommaisdeumapalavra,pesquisava-senoGoogleusandoaspasentreele,poissabíamosque,assim,a ferramenta de pesquisa online teria como resultado o termo entre aspas e nãocadapalavraindividualmente.Afinal,essapesquisaonlinefoiefetiva,poisagrandemaioriadasunidadeslexicaispesquisadasforamencontradoscomexemplosreaisdeuso.Apartirdo trabalho realizado,percebe-sequeowebcorporapodesermuitoútil e eficiente para a pesquisa de equivalentes de palavra e que a teoria dasemântica de frames é válida e temmuito a contribuir para a construção de umdicionário online. Conclui-se houve uma limitação do uso do AntConc para ospropósitosquetínhamosemmente,vistoquealgunsesportesolímpicosnãocontêmmuitomaterialtextualnainterneteprecisávamosdeumaboabaseparaacoleta.Oscorporamultimodais foramdeextremaajuda, considerandoque, senãohouvesseumequivalentenapesquisadoGoogle,porvezesconseguimosachá-loemvídeosenarrativas do esporte em questão. A combinação da semântica de frames, webcorpus e lexicografia permitiu que um dicionário completo e que muito tem acontribuirparaoconhecimentosobreesporteselinguísticafosseproduzido.

78

UMESTUDOSOBREOSPARTICÍPIOSCOMBASEEMCORPUS

LuizaTrugoeCláudiaFreitas

PontifíciaUniversidadeCatólicadoRiodeJaneiro(PUC-RIO)

[email protected]

Relatamos aqui os resultados de um estudo sobre as formas participiais doportuguês,motivadopelatarefade(re)-anotaçãodocorpusMac-Morpho(Aluísioetal. 2003) segundo o tagset do projeto Universal Dependencies(http://universaldependencies.org/). A motivação para a re-anotação doMacMorpho, por sua vez, vem do desejo de realizar estudos linguísticos quetematizemoimpactodediferentestagsets(depos,masnãosó)emsistemasdePLN.

62

Considerandooportuguêscontemporâneo,temos2grandescorporadereferência,istoé,anotadoserevistos:oBosque(Afonsoetal.2002;Freitasetal.2008)eoMac-Morpho (Aluísio et al. 2003; Fonseca et al.2003; Fonseca et al. 2015). O Bosque,partedoprojetoFlorestaSintá(c)ticaeoprimeirotreebankdoportuguês,alémdaanotaçãodepos,tambémcontémanotaçãosintática,ambasrevistasporlinguistas.Porém, com cerca de 200 mil palavras, das variantes do Brasil e de Portugal, éconsiderado um corpus relativamente pequeno. O MacMorpho contém apenasanotação de pos, mas por outro lado é de dimensões maiores, dado relevantequandosepensanotreinodesistemasemabordagensdeaprendizadodemáquina.OtagsetdeposdoprojetoUniversalDependencies(UD)vemdapropostadoGoogledetagsuniversais(Petrovetal.2012).Atualmente,jáintegramoprojetomaisde58corporaanotadosparamaisde40línguas,portuguêsincluído.NocontextodoUD,omaterialparaalínguaportuguesarefere-seaoBosque:emPetrovetal.(2012)relata-se o processo de conversão automática do Bosque para o tagset UD, e está emandamento a disponibilização de uma versão do mesmo material, mas com umaconversãoerevisãofeitasdemaneirasemi-automática,levandoemcontaumasériede análises e resoluções que só poderiam ser feitas com uma análise linguísticacuidadosa. Ou seja, já temos o Bosque com dois tagsets: tagset UD e tagset doBosque. Gostaríamos que o MacMorpho, pelo seu tamanho, qualidade e fartautilizaçãonoaprendizadodeposde línguaportuguesa,tambémpudessedispordemaisdeum tagset, epor isso a tarefade re-anotação.O tagsetdoMacMorphoébemmais granular que o do projeto UD. Algumas classes se alinham demaneiraimediata,masissonãofuncionaparatodas,comoéocasodasformasparticipiais.Jásabendodaambiguidadequeassumem,podendoserclassificadasoracomoverboseoracomoadjetivos,aequipedeanotaçãodoMac-Morphooptoupormanterosparticípioscomoumaclasseaparte,chamadaPCP.NaconversãoparaotagsetUD,éprecisodistribuirosPCPsnasclassesADJ,VERBetambémNOUNeADV.Ograndedesafio,noentanto,édistinguirentreADJeVERB,fatojáatestadoemumasériedegramáticas,emencionadodeformaexplícitaporVillalva&Silvestre(2014:164,grifonosso): “Problemas suscitados pela classificação de palavras como o infinitivo, ogerúndio e o particípio (...) indicam que as classes de palavras tradicionalmentereconhecidas constituemmatéria que pode e deve ainda vir a ser discutida”. Aolongodoprocessodeconversão,a inexistênciadeumtratamentoconsistenteedeuma posição consensual em gramáticas, teorias linguísticas e na própriadocumentaçãoUD (queafirmaapenas: “Note thatparticiples areword forms thatmaysharepropertiesandusageofadjectivesandverbs.Dependingonlanguageandcontext, they may be classified as either VERB or ADJ”) nos obrigou, em muitoscasos, a um tratamento individual das formas participiais, que não foi feito semhesitação em uma série de casos. A fim de validar nossas opções linguísticas,conduzimosumestudosobreaclassificaçãodasformasparticipiaistendocomofocoprofissionais (professores e pesquisadores) da área de Letras com experiência emgramática do português. O estudo foi feito utilizando a ferramenta Rêve(http:www.linguateca.pt/Reve), e as frases, bem como e análises(anotação) estãopúblicos napáginada ferramenta.No estudo, selecionamos frases que continhamformasparticipiaisqueconsideramosdedifícilclassificação;formasparticipiaisqueconsideramos mais claramente adjetivais e formas participiais que consideramosmaisclaramenteverbais.Pedimosaos10participantesqueclassificassemasformas

63

emquestãocomoV,ADJ,NÃOSEI,OUTRO,semprelevandoemcontaocontextoetambémapossibilidadedeclassificaçõesmúltiplas.Osresultadosforamnadireçãoque esperávamos, com uma imensa divergência na classificação das formas queconsideramos difíceis – cf. tabelas 1, 2 e 3. Ou seja, diferentemente da tarefa deanotação clássica, em que se busca verificar a concordância na anotação, o quequeríamos aqui era justamente verificar a discordância nas análises, pois nossasensaçãoeraestarmosdiantedeumaclassenadahomogênea.Estamoshabituadosapensarnasclassesdepalavrascomocategoriasdiscretas,eaanotaçãolinguísticareforçaessavisão,masosresultadossugeremque,aomenosemcertoscasos,essapode não ser a melhor solução. De fato, um comportamento não-discreto, nãocategórico, das classes de palavras é também um ponto relevante abordado emManning (2015). E, deumpontode vistadahistoriografia linguística, éde granderelevância lembrarquenemsempreosparticípios foramumaformaverbal.Desdeosprimeirosfilósofosestoicos(301a.C.),muitosestudiososconsideravamparticípios“nomes verbais”, “verbos com casos”, “verbos participiais”, dentre outros, o queenfatiza suas características mais verbais — apesar de os particípios também seflexionarememcaso,gêneroenúmero,comoosnomes.Valelembrarque,quandofoi feita a tradução das classes de palavras do grego para o latim, o particípio(participium)recebeuessenomepor“participar”tantodaclassedosnomesquantodadosverbos.Considerava-sequeparticípios “participavam”da classedosnomesdevidoàausênciadeModoeàpresençadeCasoeGênero,edaclassedosverbosdevidoaofatodeapresentaremTempoeflexõesderivadasdoverbo(Aurux,2002).Por fim,apesquisaemcorpus trouxe informaçõespara lidarcomo fenômenodasformasparticipiaisqueatéentãonãoestavamdisponíveis,enriquecendotambémadescriçãogramatical.Aliteraturalinguísticasobreotemaestábaseadaemintuiçõeseexemploscontrolados,semlevaremconsideração(porfaltademeiosparafazê-lo)comotêmsidousadasasformasparticipiais:emquecontextoscostumamaparecer,comoseuspapéismudamdeacordocomoselementosqueascercam,comovariamde acordo com o gênero e o registro linguísticos, dentre outras informaçõesrelevantesparaumaabordagemmais ricaeabrangentedo fenômeno.Eumolharlinguístico-descritivoaguçadonatarefadeanotaçãoparaPLNmostraoquantoesteúltimopodecontribuirparaampliarnossavisãodalíngua.

80

MODELAGEM DE CONSTRUÇÕES DE ESTRUTURA ARGUMENTAL NOCONSTRUCTION DA FRAMENET BRASIL: DESDOBRAMENTOS PARA OPROCESSAMENTODELÍNGUANATURAL

VâniadeAlmeidaeTiagoTorrent UniversidadeFederaldeJuizdeFora(UFJF)

[email protected],[email protected]

Opresentetrabalhoseenquadranasdiscussõesteórico-metodológicasdaFrameNetBrasil(FN-Br)apartirdeumaabordageminterdisciplinarentreLinguísticaeCiênciada Computação, a qual resulta na construção de recursos lexicais e dicionárioseletrônicos e na identificação e catalogação de construções do PB para o

64

Processamentode LínguaNatural.A FN-Br, seguindooqueé feitona FrameNet–FN, sediada no International Computer Sciences Institute, em Berkeley(http://framenet.icsi.berkeley.edu) – em relação ao Inglês, ocupa-se dodesenvolvimento de dois grandesrecursos computacionais: um Lexicon e umConstructicon. O Lexicon os objetivos de (a) descrever Unidades Lexicais (ULs) apartirdos framesqueevocame identificá-losem termosdosElementosdeFrame(EFs) que estão expressos em cada sintagma; (b) disponibilizar os resultados daanotaçãonaformadeentradaslexicais,asquaissumarizampadrõesdevalênciadecadaUL.OdesenvolvimentodoConstructiconnaFrameNetBrasilassenta-sesobreoobjetivo principal de implementar um recurso que, em complemento ao Lexicon,possa explicar os fenômenos que extrapolam as possibilidades semânticas esintáticas de unidades lexicais e, assim, descrever construções em termos de suaspropriedades gramaticais e seu potencial semântico, demodo compatível com ospressupostosteóricosdaBerkeleyConstructionGrammar,(KAY&FILLMORE,1988;FILLMORE, 2008; 2013), incorporando descrições interpretáveiscomputacionalmente para cada construção. Diante dessa gama de recursos, estetrabalho tem por objetivos fornecer a modelagem linguístico-computacionalnecessáriaparaotratamentodasconstruçõesTransitivaDiretaAtiva,ErgativaedeArgumentoCindidonoConstructicondoPBeapresentarumatarefadedescobertade construções por máquina cujo objetivo é o de identificar instâncias dasconstruções em questão. A construção Transitiva Direta Ativa caracterizadaformalmentepeloesquema [SN [VSN]]apresentaumaestruturabiargumentalemqueosdoissintagmasnominais,representadospelosujeitoeobjetodireto,indicamquem praticou uma ação e quem sofreu a ação, respectivamente, como em Joãorasgouopapel.JáaconstruçãoErgativaapresentaumaestruturamonoargumental[SN[V]]emqueosujeitoépaciente,ouseja,nãopraticanenhumaação,mas,sim,sofreoefeitodoeventoexpressopeloverbo,comoencontradoemOvasoquebrou.As construçõesdeArgumentoCindido–CACs– (SAMPAIO, 2010) são construçõessintaticamente semelhantes às transitivas, com estrutura biargumental, porémsemanticamente semelhantes às ergartivas, indicando umevento sofrido por umaentidade,comoemOcarrofurouopneu.AindasobreaCAC,ressalta-seaexistênciadeumarelaçãoTodo-Parteentreosujeitoeoobjetodireto,respectivamente.Paramodelar adequadamente as características sintático-semânticas dessas trêsconstruções foi necessário considerar (a) quais os verbos mais prototípicosencontrados nessas construções; (b) os frames que eles evocam e a qual relaçãoentre os elementos desses frames e os argumentos do verbo; (c) o frame maisgenéricoevocadopelasconstruçõesearelaçãoentreoselementosdesseframeeosargumentos das construções; (d) as relações de herança entre as construções. Anossaproposta se inseredentroda fase representacionalnoâmbitodaLinguísticaComputacional,conformeametodologiapropostaporDiasdaSilva(1996),umavezquemodelacomputacionalmenteasconstruçõesTransitivaDiretaAtiva,ErgativaeCACnoConstructicone,posteriormente,apresentaediscuteosresultadosdeumatarefadedescobertaconstrucionalpormáquinaatravésdatécnicadetravessiaemredes chamada Ativação Propagada (AP) ou Spreading Activation. A modelagemconstrucionalpermiteapresentarmosdequeformaaspropriedadesdasconstruçõesTransitiva Direta Ativa, Ergativa e CAC estão relacionadas com outras construçõesquecontribuemparasuadefinição,sejaatravésdeherança,oucomposição.Coma

65

elaboração de uma rede, mapeamos como se constituem as relações de herançaentreconstruçõesepercebemosqueasconstruçõesemestudosãotodasherdeirasdeumaconstruçãomaisgenéricaSujeito_Predicado,que,porsuavez,éherdeiradaConstrução X_Núcleo. A distinção entre os Elementos da Construção (ECs) dasconstruções Transitiva Direta Ativa, CAC e Ergativa foi corresponsável pelamodelagemdessasconstruçõesnoConstructicon,umavezquefoipossívelunificaracontraparte semântica e contraparte sintática das construções através domapeamentodosECsparaosEFsdosframesevocadosporelas.Assim,temosaCACe a Ergativa semanticamente sinônimas, porém com a CAC apresentando umarelação parte-todo entre seus argumentos o que não é observado na TransitivaDiretaAtivaqueésintaticamentesemelhanteaela.Nafaseimplementacional,quefoiadaptadadeMatos(2014),discutimososresultadosdeumatarefadedescobertaconstrucional por máquina através do parser em desenvolvimento pela FN-Br, oConstructionalAnalyzerusingRelationsamongMultipleAVMs,(CARMA).Paraessadiscussão foi realizado, primeiramente, um teste de julgamento semântico com oobjetivode estabelecimentodeumgold standardpara verificar se as construçõesemestudopossuemumpadrãosemânticoquepodeserfacilmenteidentificadoporfalantes do PB, e fornecer evidência quantitativa para sustentar essa hipótese. Otestedesimilaridadesemânticafoiapresentadopormeiodeumapesquisavirtual,criada e aplicada através da ferramentaweb SurveyMonkey.O teste continha 40sentenças, sendo 10 licenciadas pela construção Transitiva Direta Ativa, 10 pelaErgativa,10pelaCACe10sentençasdistratoras.Apartirdarealizaçãodessetesteparaoestabelecimentodeumgoldstandard,asmesmassentençasdasconstruçõesTransitiva Direta Ativa, Ergativa, e CAC foram submetidas ao CARMA. O teste desimilaridadesemânticaindicouoreconhecimento,porpartedosfalantesdoPBdospadrões das construções em estudo. A partir da comparação dos resultados,constatamosqueoparserreconheceuospadrõesconstrucionaisdamesmamaneiraque os falantes nativos do PB. Os resultados dessa tarefa apontam que arepresentação realizada no Constructicon para as construções permitiu que osistema identificasse, satisfatoriamente, 29 das 30 sentenças utilizadas noexperimento, aproximando-se do gold standard definido a partir do julgamentosemânticodasmesmas30sentençasporfalantesnativosdoPB.

86

AOSPROFESSORES,ASCOLOCAÇÕES

AndréaGeroldodosSantos

UniversidadedeSãoPaulo

[email protected]

Introdução:Estetrabalho,umrecortedenossapesquisadeDoutorado, temcomoobjetivodemonstrar como temosdesenvolvidooficinas paraprofessores de Inglêsdo Ensino Fundamental II e Ensino Médio, visando a sensibilizá-los quanto àimportância de se ensinar colocações e à utilidade das ferramentas baseadas emLinguística de Corpus para realizar tal tarefa. Para isso, valemo-nos do gênerodiscursivo “livro didático”, já que esse tipo de material se constitui em fonte de

66

conhecimento no processo de ensino-aprendizagemno Brasil e,muitas vezes, é aúnica fonte de leitura para os professores (CORACINI, 1999; SOUZA, 2002). Alémdisso,desenvolvemosessasoficinascomopartedenossotrabalhocomoeditoradelivros didáticos para o ensino de inglês para brasileiros, no SistemaMackenzie deEnsino (doravante SME) –patrocinadopelaUniversidadePresbiterianaMackenzie.Esse sistema de ensino elabora o material didático não só para os colégiosMackenzie, mas também para mais de 200 escolas no Brasil. O livro didático deInglês é constituído de unidades temáticas que apresentam textos autênticosadaptados (em geral, textos jornalísticos) e informado por corpus, valendo-se,principalmente,deferramentasdisponíveisnoCOCA:KWIC,KeyWordinContext–paraaelaboraçãodeexercícios lexicaisegramaticais;eWordandPhrase–paraaanálisedos textos autênticosutilizados, noque se refere às colocações epalavrasmaisfrequentes.Contudo,talabordagemnãoéaqueseencontranormalmentenomercado editorial de ELT (English Language Teaching) em geral (BURTON, 2012;TOMLINSON,2003),muitomenosnoBrasil,ondeoslivrosnacionaisaindatendemafavorecer textos pedagógicos curtos (criados pelos autores), listas de palavras eapresentação de regras. Tal fato, aliado ao desafio da pesquisa e adaptaçãoconstantes quando se trabalha com textos autênticos, parecem explicar por quemuitosprofessoresacabamporrejeitarmateriaisassimelaborados(HANNA,2012).Outro fator também seria a formação muitas vezes insuficiente dos docentes.Naturalmente,essesfatorestêminfluenciadoofeedbackquerecebemosemrelaçãoaomaterialdoSME.Poressarazão,elaboramosoficinasdecurtaduraçãoafimde:a) verificar o modo como os docentes abordam o texto autêntico; b) chamar aatençãoquantoàimportânciadesetrabalharaconvencionalidade,emespecial,ascolocações;c)introduzirourevisaroselementosbásicosdaLinguísticadeCorpus;d)propor que os docentes elaborem material didático com vistas ao uso de textosautênticos e ferramentas baseadas em corpus. Dessas oficinas, realizamos doispilotosrelacionadosaositens“a”e“b”supramencionados,osquaisdescreveremosneste trabalho. Metodologia: Para as oficinas, trabalhamos com dois gruposdiferentes,A(cincodocentes)eB(setedocentes), todosdoEstadodeSãoPauloeprofissionais das escolas que utilizam omaterial do SME. Em diferentes datas, osdoisgrupostrabalharamcomdoistextosautênticosadaptados:grupoA,comotextoMyths and legends: the Loch Nessmonster; grupo B, com o texto The impact ofnutritiononyourhealth.Esses textos fazempartedo livrodo8oAnodoSMEqueestava emelaboraçãoe, portanto, comoqual os docentes aindanão tinham tidocontato. Feita essa divisão, as oficinas ocorreram da seguinte forma: Oficina I(doravanteI):osgruposAeBleramostextosepropuseramdoisoutrêsexercíciosque explorassem a compreensão linguística (lexical) de seus alunos. Oficina II(doravante II): A e B observaram como os textos em que eles trabalharam em Iforamefetivamenteabordadosnolivrodo8oAno–ouseja,quaisexercíciosforampropostos,levando-seemconsideraçãoaconvencionalidade(maisespecificamente,as colocações presentes nos textos). Ainda em II, os docentes tiveram o primeirocontato com ferramentas da Linguística de Corpus, já que os exercícios propostosparaa compreensão linguísticados textosautênticosdo livrode Inglêsdo8oAnosão:a)baseadosnaanáliseobtidanaferramentaWordandPhrase(doravanteWP),notocanteàfrequênciadaspalavraseàscolocações.b)elaboradoslevando-seemconsideração o seguinte: o ensino DDL (Data-Driven Learning), ou Aprendizagem

67

DirecionadaporDados,quepropõequeoalunoinfiraregraseusosdefenômenoslinguísticos a partir da análise de corpus (JOHNS, 1991); o uso de linhas deconcordância para o ensino (TRIBBLE e JONES 1997; BERBER SARDINHA, 2004;GAVIOLI, 2005;); os “três I’s” – Illustration, Interaction and Induction (CARTER eMcCARTHY, cf. XIAO e McENERY, 2005); a Modelagem, que postula modelar osdados dos padrões a serem ensinados, com base em dados autênticos – ou seja,corpora(CARTER,1998).Todavia,considerando-seaquantidadedeinformaçõeseaduração de II (quatro horas), apenas listamos a base teórica da abordagem domaterial – e que será aprofundada nas próximas oficinas, focando também naferramentaWP.Resultados:EmI,tantoosgruposAquantoBpropuseramexercíciosemqueosalunosdeveriamsublinharoucopiaraspalavrascognatas,porexemplo:TextoA:famous,enormousecreature.TextoB:important,reduceeadults.Alémdoexercíciodereconhecimentodoscognatos,Aaindasolicitouqueosalunoslessemoquehaviamsublinhadoeapontassemaideiaprincipaldotexto.B,todavia,nãodeusequência ao trabalho com os cognatos, preferindo trabalhar com outra lista depalavrasdotexto:food,today,tomorrow,future,health(y),dietary,child/adulthood,carryebenefits.Emboraolevantamentodoscognatossejaumatécnicaimportanteparaauxiliaroalunoacompreenderumtexto,pudemosnotarqueapreocupaçãomaior dos docentes era trabalhar “listas” – ou seja, reconhecer palavras isoladas,não explorando suas (possíveis) relações, tampouco sua classe morfológica e/ougramatical.TalpreocupaçãoficouevidenteprincipalmentenocasodogrupoB,queabandonouaprimeiralista(cognatos)porumasegunda.Quandoperguntadosqualocritério utilizado para a escolha dessa segunda lista, os docentes informaram quejulgavam taispalavras “importantes”, semelaboraroporquê. Insistimosque food,today e tomorrow são bem conhecidas, já que os alunos do 8o Ano não sãoiniciantesemInglês.Nãoobtivemosrespostaànossaindagação.Asoutrasquestõespropostaspelosdois grupos saíramdoescopoquehavíamosdelineado (exercíciosde compreensão linguística, com foco no léxico): A solicitou que os alunossublinhassemtodososverbosnoSimplePast,classificando-osemregulareirregular.JáBapresentouquatroperguntasrelacionadasàcompreensãodas ideiasdotexto.Em II, distribuímos os textos novamente, e sua versão já analisada na ferramentaWP. Os docentes de ambos os grupos ficaram “maravilhados” quando viram ostextos comas palavras destacadas, de acordo coma frequênciaiv.Disseramaindaquetalorganizaçãofacilitavaavisualizaçãodeexpressões,algoqueelesnãohaviamnotadoquandodotrabalhocomostextosemI.Porexemplo:EmA:spreadrumours,take a photograph, conduct a survey e conclusive proof. Em B: (un)healthylifestyle/eating habits/weight e chronic/heart disease(s). Apresentamos, então,como essas colocações foram abordadas no livro do SME, demonstrando omodocomousamosoCOCAparanosauxiliarnabuscaporoutraspossíveiscolocaçõeseoutrosexemplos.Finalmente,osdocentestiveramacessoaalgunsdosexercícios,jádiagramadosnolivro. Osdocentesafirmaram,então,quepassaramaentenderqualera a proposta do livro do SME: abordar poucas palavras, em vez de listas, masaprofundarseuestudo,pormeiodaanálisedomodocomoelasserelacionamcomasoutraspalavras à sua volta. E emumcontexto autênticodeuso. Para aoficinaseguinte (III), pedimos que os docentes escolhessem um texto autêntico curto,fizessem sua análise noWP e elaborassem duas ou três questões para analisar acompreensãolinguísticadessetexto.Esperamosquetaisquestõespossamrefletiro

68

que os docentes aprenderam no II. Sabemos que esse é apenas um recorte dotrabalhoqueteremosdefazercomosprofessoresdasmaisdeduzentasescolasqueutilizam esse material constituído de textos autênticos e informado por corpus.Temos ciência também de que nem todos se sentirão “maravilhados” com osresultadosobtidoscomapesquisaemcorpus,sejaporquenão“gostamdelidarcomcomputador”,porque “não têm tempo”parapesquisa,ouporquepreferem“tudopronto”.Mas asduasoficinas-piloto confirmamoqueMcEnery (1998) afirmouháquaseduasdécadas:seminvestirnacapacitaçãodocenteparaousodeferramentasdaLinguísticadeCorpus,nãoadiantaránadapublicarmaterialbaseadoemcorpora.

92

INTRODUCINGBRAWE:ANEWRESOURCEFORRESEARCHERSOFEAP

LarissaGoulartdaSilva,MarineLaisaMatteeSimoneSarmento

WarwickUniversity,UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected],[email protected],[email protected]

TheaimofthispaperistodescribethecompilationofacorpusofBrazilianacademicEnglish (BrAWE). This corpus allows other researchers to use it to investigatelinguistic aspects related to English for Academic Purposes (EAP) produced byBrazilian students in comparison to other corpora such as BAWE or MICUSP, forinstance. The students represented in it are Brazilian students doing part of theirundergraduatedegreeinBritishuniversities.

95

INVENTIVIDADELEXICALNOSNOMESDEOPERAÇÕESPOLICIAIS:UMAANÁLISEPORMEIODEUMCORPUSJORNALÍSTICO

CandiceGuaratoSantos

UniversidadeFederaldeUberlândia(UFU)

[email protected]

Este trabalhoparte de duas questões: pode-se definir o estilo de nomear de umainstituição,nocaso,dapolícia?Háalgumpadrãonasdenominaçõesdasoperações?Ocorpusdeestudofoicompiladoapartirdejornais,popularesedereferência,de11cidadesdoestadodeMinasGerais.AsteoriasdaLexicologia,daOnomástica,daEstilística, dos Neologismos, e do Jornalismo, popular e de referência embasaramesta pesquisa. Os fundamentos da Linguística de Corpus (LC) colaboraram nodesenvolvimentodametodologia.Apesquisalinguística,orientadapelaLC,consistena investigação de exemplos reais da língua retirados de textos autênticos queforam armazenados no meio eletrônico. Todo jornal, segundo Amaral (2011), éproduzidoemfunçãodeumdeterminadomercado,mesmoquandoolucronãosejapretendido.Hájornaisquevisamatingirascamadassociaismaisaltas,enquantohápublicaçõesquefocamnaaudiênciademenorpoderaquisitivo.Oprimeirotipodejornal é chamado de jornal de referência, ou quality paper e o segundo tipo é

69

denominadodejornalpopular.Elessediferemnaformadetrataroqueénoticiado.O jornal popular noticia assuntos que fazem parte do cotidiano das classes maisbaixas, além de apresentarem “preços baixos, planejamento gráfico atraente,linguagemacessíveleanúnciosdeprodutoseserviçosvoltadosaopúblicodebaixarenda”(OLIVEIRA,2009,p.8).Acredibilidadeeoprestígiodiantedosformadoresdeopinião são, de acordo comAmaral (2011), características imprescindíveis em umquality paper. No jornalismo de referência, o interesse pelo mundo público éprimordial.Todosessesfatoressãoacausadosqualitypapersrespeitarem,segundoajornalista,certospadrõeséticos.Aescolhapornotíciastantodejornaispopularescomode jornais de referência se justifica pela a importância que cada umdessestiposdepublicaçãotemnasociedade.Osjornaisdereferênciapossuemprestígioeservem de parâmetro para os formadores de opinião. Por outro lado, os jornaispopulares alcançammais pessoasque atémesmonão tinhamohábitoda leitura.Selecionamosos11 jornais:Aqui,CorreiodeUberlândia,DiárioPopular,EstadodeMinas, Folha de Contagem, Gazeta de Uberlândia, Jornal da Manhã, Jornal deUberaba,OTempo,SuperNotíciaeTribunadeMinas.No total, foramcompiladas1.310notíciassobreoperaçõespoliciais.Apesquisapelasnotícias foi realizadapormeiodoGoogle,poisalgunssitesdosjornaisnãopossibilitavambuscasespecíficas.No espaço de busca do Google, inserimos as palavras operação e site que foramseguidas por dois pontos e pelo endereço eletrônico de cada jornal. As notíciasforamarquivadasno formato txt e coma codificaçãounicode, como requeremasconfiguraçõesdoWordSmithTools (SCOTT,2012).As informaçõessobreadatadecoleta,afonte,ojornalista,autordanotícia,eadatadepublicaçãoforaminseridasentre chaves angulares. Esse é um recurso que impede o programa de processarcertos dados. Cada arquivo foi nomeado de acordo com a data de publicação earmazenado em pastas homônimas aos seus jornais. Por meio da ferramentaConcord, buscamos pela palavra operação. A partir das linhas de concordância,identificamos os nomes das operações e acessamos o source text paraidentificarmososentidodecadaoperação.Emalgunscasos,nãohaviaadefiniçãoenemoporquêdaescolhadonome,poisnãoeraaprimeiravezqueaaçãopolicialfoinoticiada.Emsituaçõescomoessas,realizamosoutrabusca,noGoogle,pormeiodocomando “define: operação”. Assim, a partir de outras notícias e foi possívelidentificarosentidodonomedaoperação.Osnomesforamclassificadosdeacordocom campos semânticos como, por exemplo, Datas/Feriados,Bens/dinheiro/patrimônio/propina, Doença/Hospital/Saúde,Ficção/Filme/Personagens,Grécia/Mitologia,Judiciário/Lei,NomeprópriodepessoaeNome próprio de lugar. Pormeio da análise, observamos que grande parte dosnomesdasoperações,presentesnocorpus,sãoneologismos.Otipomaiscomuméoneologismosemântico,seguidopelosempréstimos.Entreoscasosdeneologismossemânticos,podemosdestacar aOperaçãoGenitoraqueprendeuumhomemquechefiavaumnegóciodotráficocomseusirmãos.Segundoanotícia,onomefoiumareferência à mulher que deixou como herança para os três filhos o controle dotráficodedrogasdasbocasdefumo.Osempréstimosmaiscomunssãooriundosdoinglês (operações American Dream, Firewall, For All e Reset) seguido pelosprovenientes do grego (operações Aletheia e Argos Panoptes). Identificamosdenominações que são epônimos, ou seja, foram inspiradas em personagens dedesenhos animados como a Operação Dick (nome inspirado no personagem Dick

70

Vigarista), Operação Liga da Justiça e Operação Mandrake II. Filmes tambéminspiraramdenominaçõescomoaOperaçãoKrulleaOperaçãoTriploX.Oscasosdenomes inspirados em topônimos são: Operação Carajás, uma alusão ao bairro deContagem, Operação Faixa de Gaza, Operação Triângulo das Bermudas, OperaçãoSamoaeOperaçãoBHSegura.Acreditamosqueosrecursoslinguísticosutilizadosnacriaçãodosnomesdasoperações,presentesnocorpusdeestudo,sãoempregadoscomafinalidadedecausaralgumefeito,comooderessaltaraimportânciadaaçãopolicial,chamaraatençãopormeiodohumoroupormeiodenomesimponentes,umavezqueessesnomescirculamnaimprensa.

97

A LINGUÍSTICA DE CORPUS EM INTERFACE COM ANÁLISECONTRASTIVAEPRESSUPOSTOSDATRADUÇÃO:UMAPOSSIBILIDADEDE AUXÍLIO PARA PROMOÇÃO DE AUTONOMIA NA FORMAÇÃO DOPROFESSORDELÍNGUAINGLESA–ESTUDODECASONOCAMPUSXIVDAUNEB

LavineCunha

UniversidadeEstadualdaBahia

[email protected]

NesteensaiotrataremosdediferençasmorfossintáticasentreLínguaPortuguesa(LP)e Língua Inglesa (LI), especificamente adjetival orders. Através da abordagem daAnálise Contrastiva (AC) (Fries & Lado, 1957), e pressupostos da tradução (Baker,1992), em interface com a Linguística de Corpus mostraremos como o professorpodeadquirirmaiorautonomiaduranteaquisiçãodeLIquantoaocomportamentodosadjetivos.

110

ELABORAÇÃO DE UM PROTÓTIPO DE GLOSSÁRIO BILÍNGUE(PORTUGUÊS-INGLÊS) DE TREINAMENTODE FORÇA: SUBSÍDIOS PARAOTRADUTOR

MárciadosSantosDornelles

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

Oterminógrafo,aoelaborarumprodutoterminográficobilínguebaseadoemcorpuspara tradutores, deve preocupar-se não só em repertoriar, nas duas línguas, ostermosprópriosdeuma(sub)áreadoconhecimento,mastambémemapresentá-losinseridos em suas combinatórias típicas, ou seja, associados aos elementos que aeles se combinamemnível sintagmático, de forma recorrente nos textos daquelaespecialidade. Isso porque o tradutor precisa produzir um texto de chegadaadequadoaopadrãode linguagememfoco,de formaaespelharomodusdicendi

71

daquelecampo.Assim,seutextosoaránaturalàcomunidadedeleitores,evitando-se ruídos na comunicação. Para tanto, assim como um biólogo precisa explorar omeioemqueviveseuespécimedeestudoparaentenderocomportamentodeste,também o terminógrafo precisa conhecer o habitat dos termos: o textoespecializado.Nesse sentido, o conhecimento das propriedades do gênero textualem estudo qualifica um produto terminográfico, considerando que os termos edemais elementos a ele incorporados, como as fraseologias especializadas, oscontextos definitórios e os exemplos de uso, extraídos de seu âmbito natural deemprego,ajudamacomporosmodosdedizerdessegênero.Somentedessaformaumprodutoterminográficotemchancesdeseraceitopelacomunidadedaárea.Emsíntese,ogênerotextualéumelementocondicionantedoperfildasterminologias.Comessespressupostosediantedafaltadeprodutosterminográficosbilínguesnoâmbito do Treinamento de Força, especialmente dirigido a tradutores brasileiros,esta pesquisa de mestrado (DORNELLES, 2015b) teve como objetivo centralapresentar bases teórico-metodológicas consistentes para a elaboração de umglossário de Treinamento de Força na direção português→inglês, destinadoespecialmente a tradutores, mas útil também para pesquisadores e estudantesdessa temática que precisem produzir artigos científicos em inglês. Os objetivossecundários, todos alcançados, foram (a) oferecer um protótipo do glossário,compostodeguiadousuário,umaárvorededomínioemportuguêsdoTreinamentodeForça,listadetermosemportuguêse30exemplaresdefichasterminológicasemformatoestendido;e (b)oferecerumadescriçãodocomportamentodasunidadesterminológicas em português e inglês, e das unidades fraseológicas especializadas(UFE) eventivas (BEVILACQUA, 2003; 2004) em português nos artigos sobreTreinamento de Força. Como referencial teórico, valemo-nos dos princípios daTeoria Comunicativa da Terminologia (TCT) e dos fundamentos e diretrizes daLinguísticadeCorpus(LC).SeguiraTCT(CABRÉ,1999a;1999b;2001a;2001b;2003;2009)implicaadotarotermocomoobjetocentraldeestudoeconcebê-lo,antesdetudo, comoumaunidade lexical da língua natural que adquire valor especializadodentro de um contexto especializado, segundo critérios semânticos, discursivos epragmáticos.SeguiraLC(BERBERSARDINHA,2004;BIBER,2012;)implicaumavisãoprobabilísticada língua,pressupondoque,emboramuitostraços linguísticossejampossíveis teoricamente, não ocorrem com a mesma frequência. Ganham, ainda,realcenoestudoostemasdoartigocientíficocomogênerotextualespecializado;davariaçãoterminológica(FREIXA,2002;2014);datraduçãocomoprocesso(HURTADOALBIR,2008);dacompetênciatradutória(PACTE,2011);edaequivalênciafuncional(GÉMAR,1998;NORD;1998).Nossocorpusdeestudoéconstituídode70artigos–originais e de revisão – de periódicos científicos de destaque no âmbito doTreinamentodeForça,escritosoriginalmenteemportuguêseinglês.São,portanto,dois subcorpora, um em cada língua, que são comparáveis. Os periódicos, todosonline, foram recomendados por um consultor especialista em Treinamento deForça.AbuscainicialdosartigosfoifeitanaspáginaseletrônicasdasrevistasnabasededadosSciELO(artigosemportuguês)enoPortaldePeriódicosdaCAPES(revistasem inglês), pelos assuntos “treinamento de força” e “strength training”,respectivamente.Naslistasdeartigosresultantesporrevista,selecionamosaquelespublicadosapartirde2002.Após, comoauxíliodoconsultor,excluímosos textosque pareciam descolar o tema do Treinamento de Força do âmbito da Educação

72

Física, ou seja, não focavam o treinamento em si. Eliminamos, assim, artigos depesquisas com animais; artigos com enfoque clínico; e aqueles mais inseridos nocampo da Bioquímica. Para exploração e análise do corpus, utilizamos o softwareAntConc(ANTHONY,2011),especialmenteasfuncionalidadeskeywordlist,n-gramseconcordance.Comomaterialdeapoio,utilizamoslivros-textoeartigoscientíficosdereferênciasobreTreinamentodeForça,umglossárioparticularpré-existentedeEducação Física, a Terminologia Anatômica Internacional (SBA, 2001), o GoogleAcadêmico,oWikipédia,entreoutros.Oscritériosparaofichamentodasunidadesterminológicas foram a distribuição e a frequência no subcorpus em português; apertinênciatemáticaeapertinênciapragmática(MACIEL,2001);oencaixenaárvorede domínio; e a existência de pelo menos um equivalente em inglês,preferencialmente no subcorpus em inglês. Como resultados da investigação,oferecemos um protótipo de glossário composto de árvore de domínio emportuguês,comumapopulaçãode71unidadesterminológicas(UT)eumaamostrafichadade30UT(42,25%);Guiadousuário;umaListadetermosemportuguês,com30 UT-lema e 89 UT variantes; 30 fichas terminológicas; e 78 termos em inglês,sendo 30 equivalentes preferenciais e 48 variantes. A microestrutura da fichaterminológica,baseadanaspropostasdeFromm(2007)eTeixeira(2008),contemplaos seguintes itens: unidade terminológica (UT) em português;sigla/abreviatura/acrônimo/fórmula/ símbolo, conforme o caso; informaçãogramatical;frequênciadaUTnocorpus;áreae(sub)domínio;númerodeposiçãonaárvorededomínio(comhiperlinkparaaárvore);figura;linkparavídeo(p.ex.,parademonstrar um exercício); definição simplificada em português; outras definições,com as fontes; variante(s) em português, com remissiva (hiperlink), frequência nocorpus e observações sobre uso; equivalente(s) em inglês com a frequência eobservações sobre uso; fraseologia(s) em português; equivalente(s) em inglês dasfraseologias;exemplo(s)deocorrênciasemportuguêseinglês;UTrelacionadas,comremissivas(hiperlink)paraasrespectivasfichas;notasdeuso;notasdetradução;edadosderevisãodaficha.ComocaracterísticasdaterminologiadoTreinamentodeForça em artigos científicos, quanto à suamorfossintaxe, verificamos um númerobastantemaiselevadodeUTpolilexicais (85%emportuguêse86%em inglês)emrelaçãoàsmonolexicais (9e8%)eàs siglas/abreviaturas (6%nasduas línguas).Asestruturasmaisrecorrentesnostermosemportuguêsforamquatro:N+prep(+art)+N(34%),p.ex.,intervaloderecuperação;N+ADJ(30%):pesoslivres;N+N(6%):roscabíceps;N+ADJ+ADJ(6%):forçamáximaisométrica.Eminglês,asestruturasmais recorrentes foram cinco:N +N (35%): strength training;ADJ +N (18%): freeweights;ADJ+N+N(8%):single-jointexercises;N+V(6%):bicepscurl;ADJ+ADJ+N (5%): maximum isometric force. As UFE eventivas em português não foramnumerosas comoesperávamos,mesmoadotandouma frequência/distribuiçãonãomuitoalta,comoéa2/2.Poressecritério,encontramos33unidadesnocorpusdeestudo. As ferramentas do AntConc mais utilizadas para o seu reconhecimentoforam as concordances, seguidas dos clusters. Os núcleos eventivos comnominalizações foram três vezesmais frequentes que com verbos e quatro vezesmais frequentesquecomparticípios.Veja-se:nominalizações:21UFE(64%),comoempráticadetreinamentodeforça,combinação{de/das}variáveisdotreinamento,aumento{da/na}intensidadedotreinamento,execução{de/dos}exercíciosdeforça;verbos: 7 UFE (21%), como realizar (um) treinamento de força, determinar a

73

intensidadedotreinamento,executar[NUM]séries,etc.;eparticípio:5UFE(15%),comotreinamentodeforçarealizado,númeroderepetiçõescompletadas,unidadesmotoras recrutadas. Há certo grau de variação (comutação) também nos núcleoseventivos das UFE, o que não afeta sua estabilidade semântica nem asdescaracterizacomounidadessemifixas.CertosnúcleoseventivosdasUFEcarregamum valor terminológico que se equipara ao de seus núcleos: p. ex.,recrutamento/sincronizaçãodeunidadesmotoras.Destaca-se,ainda,nosresultadosdesta pesquisa e de outros três estudos exploratórios anteriores (DORNELLES,2014a;2014b;2015a)umaexpressivavariaçãoterminológicaintraeintertextual,nasduas línguas.AlgumasUTapresentam,aomesmotempo,variaçãodenominativaeuma sutil variação conceitual. Em português, cada UT-lema apresentou de 0 a 7variantes.Quantoaostiposdevariação(cf.FREIXA,2002),encontramosalexical:31variantes(53%),comonosparestreinamentodeforça/treinodeforça;exercíciosdeforça/exercícios resistidos; extensão de joelho/extensão de perna(s); por redução:12 (20%), como em rosca scott/rosca bíceps scott; barra livre/barra; hipertrofiamuscular/hipertrofia;morfossintática:7(12%);gráfica:7(12%),comoemvolumedotreinamento/volumedetreinamento;extensãodejoelho/extensãodejoelhos;forçamáxima isométrica/força isométrica máxima; e complexa (lexical e reduçãoconcomitantemente): 2 (3%), em treinamentode força/musculação e treinamentodeforça/treinoresistido.Eminglês,cadaequivalentepreferencialapresentoude0a5 variantes. Os tipos foram lexical: 21 variantes (43%), como nos pares strengthtraining/resistance training; rest period(s)/rest interval(s); gráfica: 11 (23%), comoem repetition(s)/rep(s); repetition maximum/RM; multi-joint exercise(s)/multijointexercise(s); por redução: 8 (17%), como em training variables/training programvariables; concentration curl/biceps concentration curl; emorfossintática: 8 (17%),comoemrestperiod(s)/restingperiod(s);musclepower/muscularpower.Apesquisacontempla,então,umaparteteóricaeumaparteaplicadaqueseinter-relacionamese inserem na dupla face da Terminologia, visto que há uma descrição de umalinguagemespecializadaapartirdeumdadopontodevistateóricoeodesenhodeumprodutoconcreto.

74

Resumos Minuto de Loucura

75

13

AELIUSFALADO2.0:PRIMEIROSPASSOS

MônicaRigoAyreseGabrieldeÁvilaOthero

InstitutodeLetrasdaUniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

Estetrabalhoinsere-senasáreasdeLinguísticaComputacional,LinguísticadeCorpuse análise morfossintática do português brasileiro, mais especificamente sobreanotaçãoautomáticamorfológicadecorporadelínguafalada.Pretendemosproporuma nova versão do etiquetador automáticomorfossintático Aelius, desenvolvidooriginalmente pelo prof. Dr. Leonel Alencar, da Universidade Federal do Ceará,coordenador do projeto CompLin – Computação e Linguagem Natural. Esseetiquetador foiplanejadoedesenvolvidoparaetiquetar textosde línguaescrita,ecumpre seu papel satisfatoriamente. A nova versão que estamos desenvolvendoserá desenhada para etiquetar textos de língua falada. As etiquetas utilizadas noAelius foram propostas pelo desenvolvedor do programa, e são as mesmas docorpusdeportuguêshistóricoTycho-Brahe(corpuseletrônicojáanotado,compostodetextosemportuguês).OstextosqueutilizamosparaaprimeirafasedoprocessodeanotaçãodelínguafaladasãodobancodoprojetoVarsul,queestudaavariaçãolinguísticanaregiãoSuldoBrasil.

Em trabalhos anteriores (AYRES 2014; OTHERO & AYRES 2014), verificamos odesempenhodoAeliusnaetiquetagemmorfossintáticaautomáticadeumtrechodocorpus do Varsul (constituído por 20 amostras de textos, num total de 154.530palavras), um desafio inédito para a ferramenta até então. A partir dos erros doetiquetador, buscamos depreender certos padrões de anotação para superarlimitações apresentadas pelo programa, propondo algumas sugestões deimplementaçõesparaqueoAeliusetiquetassedemaneiramaissatisfatóriacorporade língua falada. Tratamos especialmente dos casos de interjeições, aféreses,onomatopeiasemarcadoresdiscursivos/conversacionais,quesãomarcasespecíficasdaoralidade.

Aolongodosúltimosanos,aLinguísticadeCorpusnoBrasilaumentouseuescopodepesquisa,abrangendoa línguafaladaalémda línguaescrita(BERBERSARDINHA2000), e as transcrições de corpora falados possuem características específicas dafala, tais como repetições, contrações, aféreses, marcadores conversacionais,fragmentos de sentenças, interjeições e truncamentos. Por isso, é de extremaimportância que o anotador dê conta de etiquetar corretamente todas essasinformaçõesquefazempartedafala(comonotrechoseguinte).

Não/NEGsei/VB-Po/Dquê/WPRO,/,aí/ADVeu/PROdisse/VB-D:/."/QTAh/INTJ,/,que/C delícia/N isso/DEM !/. Que/C bom/ADJ é/SR-P gente/N da/P+D-Fminha/PRO$-Fterra/N,/,né/NPR?/.Que/Cestá/ET-Pindo/VB-Gaqui/ADV"/QT./.Muito/Qgaúcho/N,/,claro/ADJ,/,né/NPR?/.

76

A palavra “claro”, nesse contexto, não é um adjetivo, como foi analisada peloetiquetador, mas um marcador conversacional. Como essa é uma palavra lexical(diferentemente de outros marcadores conversacionais, como “hum”, e “tarará”,por exemplo – que também apareceram no corpus que analisamos), ela temdiferentespossibilidadesdesignificado,i.e.dependendodocasodevereceberumaetiqueta diferente; por isso, o algoritmo precisa ser bem treinado. Sendo assim,deve-se levar em conta a posição da palavra na frase, por exemplo: se a palavra“claro”apareceimediatamenteapósumnome,achancedeserumadjetivoémuitogrande,mas, se aparece entre vírgulas, a probabilidade é de que se trata de ummarcadorconversacional.Pretendemosbuscarsoluçõesparaqueumanovaversãodo etiquetador consiga lidar satisfatoriamente com ocorrências como essas,específicasdaoralidade.

15

ALIMENTOS REGIONAIS BRASILEIROS: ESTATÍSTICA LEXICAL, GÊNEROTEXTUALEACESSIBILIDADETEXTUAL

LauraDupkedeAlmeida

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

ComapoioderecursosdaLinguísticadeCorpus(BERBERSARDINHA,2004),explora-se aqui, em um estudo inicial, o perfil do vocabulário da segunda edição do livro“Alimentosregionaisbrasileiros”,umguiade486páginasdoMinistériodaSaúdedoBrasil, lançadoem2015, que visoudivulgar a alimentação saudável paraqualquercidadãointeressadonotema.Tomadoesselivrocomoumcorpusdeestudo,busca-se reconhecer o gênero textual nele envolvido conforme Marcuschi (2002) eidentificar o perfil de vocabulário partindo-se dos trabalhos de Evers (2013) e deFinatto(2014).Oobjetivodotrabalhoérealizaraanálisedessaobraemparticularpara, futuramente, somá-la a um acervo de produções escritas, de diferentesgêneros, destinadas a leitores de escolaridade limitada e pouco hábito de leitura.ComosprogramasAntConc, FleschCalculatoreTermoStatWeb,observam-se,emuma amostra de 40 páginas domesmo, a lista e a frequência de palavras, ÍndiceFlesch(IF),types/tokensratio(TTR),trigramasmaisfrequenteselistadekeywords,característicasponderadascoma funçãodaobrae seupúblico-alvo.Aquestãodaacessibilidade textual, considerandoelementoscomoescolhadepalavraseusodevocabulárioespecíficotambéméponderadaapartirdessadescriçãoinicialdaobra.Emboraemfase inicial,preliminarmente,apartirdaanálisedaamostra,com5749tokense1306 types, já sepodeperceber: a) vocabulário relativamente repetitivo,comTTRde20,04%–pois,emcontraste,umartigocientíficodePediatria tendeaexibir24%deTTR(cf.FINATTO,2011);b)textodeleituramuitofácil,comverificaçãodo IF em 93,83, enquanto um artigo de Pediatria mostra cerca de 27 (FINATTO,2011) sendo bastante difícil; c) “de” e “e” como palavras gramaticais maisfrequentes–seguindoomesmopadrãodediferentestextosescritosemportuguês(ZILIO,2010;FINATTO,2011e2014);quantoàspalavraslexicais,asmaisusadassãoabreviaturas,taiscomo“g”(grama),“mg”(miligrama),entreoutros.Portratarsobre

77

alimentosregionaisdoBrasil,háváriosnomesdeingredientesquepoderiamcausarestranhamento para leitores de determinadas localidades, como “abiu”, “camu-camu”,“abricó”etc.Comessaamostradolivro,pressupõe-sequeotextopretendaintegrar público leigo e especialistas, pois traz diferentes tipos de informaçõestécnicas sobre alimentos regionais, assim como receitas e possíveis preparaçõesculináriascomosalimentosapresentados.Assim,aindaquesetrateaquideexplorarumaúnicaobra,poder-se-iaidentificar,aprincípio,doisgênerostextuaisenvolvidos:1) enciclopédia, pois apresenta uma série de alimentos separados pela regiãoproveniente,eumconhecimentoaprofundado,técnico-científico,sobrecadaum;2)receita culinária, com ingredientes emodode fazer. Esses dois gêneros aparecemintercalados,sendoqueoprimeiro,emtese,dadaapresençadeterminologiassema devida explicação, poderá trazer problemas de acessibilidade para leitores deescolaridade limitada.Outroaspectoa salientaréouso vocabulário regional. Esteestudo deve prosseguir com foco específico na parte enciclopédica, objetivandodescrever possíveis pontos de complexidade do vocabulário técnico-científico –especialmente da terminologia – para leitores leigos. Feito isso, também serãotratados alguns elementos peculiares dos vocabulários regionais na parte dasreceitas, que, teoricamente, deveriam ser compreensíveis para qualquer leitor doBrasil. Para o estudo das receitas e sua complexidade, pretende-se recorrer aotrabalhodeTeixeira(2008).

16

A ELABORAÇÃO DE UMDICIONÁRIO DE ELEMENTOS COESIVOS COMBASEEMCORPUS

DanielaFariaGramaeGuilhermeFromm

UniversidadeFederaldeUberlândia(UFU)

[email protected]

Esteresumorefere-seaumapesquisadeDoutoradoqueestáemfaseinicialequevisaàelaboraçãodeumdicionáriodeelementosdecoesãodoportuguês,combaseemcorpus,paraalunosdoEnsinoMédio.Pararealizaçãodapesquisa,prevemosumtrabalhometodológicominucioso com o corpus de redações que constituímos noMestrado, conforme Grama (2016). Inicialmente, aumentaremos tal corpus, queatualmentepossui1399textosdotipodissertativo-argumentativo,comasredaçõesde2015e2016disponibilizadasnositeUOLEducação.Depois,revisaremosocorpusderedaçõesemsuatotalidadeparaverificarserestarampalavrasunidasecolchetescom sugestões de correção. Para isso, utilizaremos as ferramentas WordList eConcorddoWordSmithTools (SCOTT,2012).Outraetapa importante compreendetodooprocessodedescriçãoeanálisedocorpusderedaçõesqueseráfeitocomointuitodeobtermosaspalavrasquefarãopartedamacroestruturadodicionárioeasinformações que constarão na estrutura da ficha lexicográfica, produzida noMestrado, de cada palavra-entrada do dicionário de elementos coesivos.Utilizaremos o corpus para verificar quais elementos coesivos (unipalavras emultipalavras) existeme devem fazer parte damacroestrutura do dicionário. Paraisso, faremos uma WordList do corpus e anotaremos as palavras candidatas a

78

elementoscoesivos.Verificaremosocontextolinguísticodecadauma,pormeiodaferramenta Concord, a fim de confirmarmos se são elementos de coesão. Valeressaltar que esse procedimento será realizado apenas com aquelas palavras quenão fazem parte da lista de 255 elementos de coesão que fizemos noMestrado.Tambémusaremosocorpusparaidentificarafrequênciadaspalavrasnafunçãodeelementoscoesivos.Devidoàpotencialidadequeaspalavrasda línguaportuguesapossuem,éprecisoverificarosseuscontextoslinguísticos,pormeiodaferramentaConcord, pois, como vimos em nossa dissertação, nem sempre o porém, porexemplo, será usado como conjunção, ele pode ser usado como substantivo.Portanto, esse procedimento é fundamental para obtermos a frequência exata deuso de cada elemento coesivo. Alémdisso, usaremos o corpus para contabilizar aposição textual que cada elemento coesivo é utilizado e para analisar ocomportamento/uso dos elementos coesivos, o que nos auxiliará a elaborar adefinição e as notas (contaremos também com as contribuições da LinguísticaTextual e da Semântica Argumentativa). O corpus de redações será útil paraextrairmosexemplosdeuso.Paraisso,utilizaremososmesmoscritériosestipuladosemnossadissertaçãodemestrado: exemplosqueestejamemconsonância comadefiniçãoelaborada,quelevememconsideraçãonãoapenasadimensãofrasal,mastambém a textual, que tenham coerência e estrutura sintática majoritariamentebemformadaequerespeitemosdireitoshumanos.Temosointuitodeacrescentarno Back Matter do dicionário, que será uma ferramenta de consulta online,exercíciosquepossamauxiliaros consulentesa compreenderema importânciadousodoselementosde coesãoemumaprodução textual. Provavelmente,o corpusserá útil nessa tarefa também. Assim, com o auxílio do corpus de redações,esperamos obter resultados satisfatórios que contribuirão para a elaboração donossodicionáriodeelementoscoesivos.

19

ORGANIZAÇÃO TEMÁTICA DE FOLHETOS INFORMATIVOS PARA AAGRICULTORES FAMILIARES DO BRASIL: UM ESTUDO BASEADO EMCORPUS

GiselleFetter UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

ApartirdeestudossobreAcessibilidadeTextual(BAILIN;GRAFSTEIN,2016;MYERS,2002, 2004; COULTHARD, 2004; LEFFA, 1996), com ênfase no gênero divulgaçãocientífica (FINATTO et al., 2016; CIAPUSCIO, 2003) e da Linguística Sistêmico-Funcional (HALLIDAY; MATTHIESSEN, 2014; FUZER; CABRAL, 2014), este trabalho,com apoio de recursos da Linguística de Corpus, tem como foco a terminologiapresentenasestruturastemáticasdostextosdefolhetosinformativosinstitucionaisdirecionados aos agricultores familiares. O objetivo da descrição é subsidiar umaavaliação terminológica com vistas à acessibilidade textual desses materiais paraleitores de escolaridade limitada. Conforme a perspectiva sistêmico-funcional, otextoédeterminadopelocontexto,emoutraspalavras,agramáticadeumalíngua

79

estáemconexãocomoseuentornoecomosprocessossociaisemqueosindivíduosestãoenvolvidos(HALLIDAY;HASAN,1989).Assim,asescolhaslexicogramaticaisdoindivíduosemanifestamconformeseupropósitoepodemseranalisadasapartirdetrês metafunções: ideacional, representação de mundo interno ou externo;interpessoal, expressão da relação entre as pessoas; e textual, a oração comomensagem.Estapesquisa,aodescreverotextoescritodessesfolhetos,destacaráametafunçãotextual,emqueaoraçãoéobservadaporsuasduaspartesconstitutivasdenominadasTemaeRema.OTemadeterminaocontextodaoraçãoeéescolhidopelo emissor para orientar o receptor. Já o Rema é responsável pelodesenvolvimento do Tema. O corpus de estudo é composto por 30 folhetosproduzidos pela Associação Riograndense de Empreendimentos de AssistênciaTécnica e Extensão Rural (EMATER-RS) e, como corpus de contraste, tem-se 30folhetosproduzidospelaEmpresaBrasileiradePesquisaAgropecuária (EMBRAPA).Primeiramente,realizou-seumaanotaçãomanualdostiposdeTemasdasfrasesdocorpus e seu levantamento lexical-quantitativo com o recurso Concord daferramenta WordSmith Tools. Com o auxílio dessa ferramenta, foram analisadas4867 orações de folhetos da EMATER/RS e da EMBRAPA, excetuando-se as frasescujosTemasnãopuderamserdefinidos.OsresultadosiniciaisapontamquefolhetosdaEMATER/RSapresentam:a)maiorocorrênciadeTemasSimples;b)frasesquenãoretomamoTemadafraseanterior,oquepodeprejudicaracontinuidadedaleitura;c) alta incidência de termos científicos; d) termos presentes nos Temas semdefinição; e) pouco uso de elementos textuais como conjunções e adjuntosconjuntivos.Os folhetosdaEMBRAPAapresentam:a)alta incidênciadeelementostextuais;b)altaincidênciadeelementoscircunstanciais,quepodemcolaborarparaodesenvolvimentodamensagem;c)usodeelementosinterpessoaisqueexpressamopinião. Na continuidade desta pesquisa, pretende-se apontar a totalrepresentatividadedostiposdeTemasnosfolhetosdeambasinstituições,ototaldetermospresentesnasestruturastemáticase,porfim,verificarqualaestratégia,nocaso de sua ocorrência, utilizada nos folhetos para a definição desses termos.Tambémpretende-se,apósaobtençãodosresultadosfinais,fornecersubsídiosparaa escrita de materiais instrucionais mais acessíveis para leitores com perfilcompatíveldenossosagricultoresfamiliares.

21

SOFTWARE PARA ALFABETIZAÇÃO DE AUTISTAS NO MUNDO DAASTRONOMIA

GuilhermeQueirozVasconcelos,CinthyanRenataSachsC.deBarbosa,JoãoCoelhoNetoeFernandaMafort

UniversidadeEstadualdeLondrina;UniversidadeEstadualdoNortedoParaná–CornélioProcópio;PontifíciaUniversidadeCatólicadoParaná

[email protected];[email protected];[email protected];[email protected]

O presente trabalho apresenta os passos iniciais do projeto de um software paraalfabetização de crianças autistas, traçando um aporte teórico e os passos

80

metodológicosutilizadosparaconstruçãodosoftware,apresentadooconteúdodealfabetizaçãodesenvolvido,bemcomoaspropostasfuturas.

22

METÁFORASSOBREREFUGIADOSNOJORNALFOLHADES.PAULOEM1994E1995

LucianeCorrêaFerreiraeCatarinaValleeFlister UniversidadeFederaldeMinasGerais(UFMG)

[email protected],[email protected]

Essapesquisabuscadescobrirquaissãoasmetáforasrelacionadasaositenslexicaisrefugiado, refugiados, refugiada, refugiadas no jornal diário Folha de S. Paulo nosanos de 1994 e 1995. Trabalhamos com 730 edições do jornal referido,disponibilizados através do site da Linguateca, na colecção CHAVE, maisespecificamentenaCHAVEFolha.Analisamosasnotíciasapartirdoquadro teóricoda Linguística Cognitiva. Dessa forma, trabalhamos com a Teoria da MetáforaConceptual de Lakoff e Johnson (1980), que postula que as metáforas, emboraexpressadas pela linguagem, não são figuras de linguagem, mas sim figuras depensamento. A partir da Teoria da Metáfora Conceptual, buscamos descobrir aideologia subjacenteacercados temados refugiadosno jornalpesquisado.A ideiadequepodemosdetectarideologiasatravésdaidentificaçãodaMCnodiscursoestáemCharteris-Black (2004).Esseautorafirmaqueametáfora,alémde linguísticaecognitiva,épragmática.Assim,eladeveserinvestigadaconsiderandoocontextodeprodução e as intenções do falante – nesse caso, as intenções do meio decomunicação. O tema dos refugiados foi selecionado para nossa pesquisa por setratardeumtemaatualnaagendamidiáticamundial.Escolhemosadécadade1990porqueessaéumapesquisainicial,apartirdaqualpretendemosconduziroutras.Adécadade1990marcouo início deumapolíticamais favorável aos refugiadosnoBrasil. Assim, achamos importante mapear a ideologia vigente a partir dessemomento.Alémdisso,aquestãodosrefugiadosésocialmenterelevanteepresente,oquefazcomquealinguagemrelacionadaaotemaestejaemconstanteevolução,visto que novos significados estão sempre sendo construídos à medida em quenovospensamentossãocomunicados.Paraconduziraanálisedosdados,usamosametodologia da Linguística de Corpus. Especificamente, usamos Stefanowitsch(2006), que pesquisa a metáfora no corpus. Para explicar tal metodologia, énecessária uma breve explicação acerca das nomenclaturas usadas na Teoria daMetáfora Conceptual. A metáfora consiste em “tomar uma coisa em termos deoutra” (Lakoffe Johnson,1980,p.XX),ouseja,éumarelaçãoentredoisconceitos.Na teoria de Lakoff e Johnson, cada conceito ocupa o lugar de um domínio. Oconceito usado enquanto metáfora é o domínio alvo e o conceito usado paraentender o outro domínio conceptual é o domínio fonte. O método deStefanowitsch(2006)consisteemselecionarumitemlexicaldodomínioalvo,buscarasocorrênciasdesseitem,identificarasexpressõesmetafóricasqueaparecemnesseresultado – a partir da definição de Lakoff e Johnson (1980) – e, finalmente, emagruparmapeamentossemelhantes.Essemétodonospermitevisualizaros frames

81

discursivosmetafóricosquesubjazemosdiscursos jornalísticos.Aanálise totaldasnotícias ainda não foi completada. No entanto, podemos indicar como resultadoparcial a presença da metáfora REFUGIADO É CRIMINOSO que aponta para aideologia dominante REFUGIADO É RUIM. Tal resultado pode ser uma evidênciafortedequeosrefugiadosnãosãobem-vindosnoBrasil.

27

PLANEJAMENTO, COMPILAÇÃO E ALINHAMENTO DE UM CORPUSPARALELO DE LITERATURA CANADENSE: TRADUÇÃO E RETRADUÇÃOEMPORTUGUÊSBRASILEIRODELIFEOFPI

RaphaelMarcoOliveiraCarneiro

UniversidadeFederaldeUberlândia(UFU)

[email protected]

Este trabalho relata o planejamento, a compilação, o alinhamento e uma análiseinicial que testou a hipótese da retradução em um corpus paralelo bilíngueconstituídopeloromanceLifeofPidoautorcanadenseYannMartel,pelatraduçãoAVida de Pi da tradutora brasileira Alda Porto e pela retradução A Vida de Pi datradutorabrasileiraMariaHelenaRouanet.

30

THE ANGELINA JOLIE EFFECT IN BREAST CANCER INFORMATIONSOURCES:ACORPUSSTUDY

AnaLuizaPiresdeFreitas,AlineAverVanin,FernandaLopesdeSouzaandElianeRabin

UniversidadeFederaldeCiênciasdaSaúdedePortoAlegre(UFCSPA)

[email protected],[email protected],[email protected],[email protected]

InMay2013,actressAngelina Joliehada radicalmastectomysurgeryafterhavingfound out she was carrying a genetic mutation that greatly increased her risk ofpotentially fatal breast cancer. The advances in technology which enable thelikelihoodofpreventingtheonsetofbreastcancerassociatedwithJolie’sconstantpresence in international media boosted a phenomenon known as the ‘AngelinaJolie Effect’, according to which celebrity profile can trigger a major impact onprovisionofcancer relatedservices (EVANSetal,2014;2015).ThispaperexploresthepotentialofacorpusstudyfollowingtheprinciplesofCorpusLinguistics(BIBER,1995; 2006; BIBER AND CONRAD, 2009; HALLIDAY, 1992;MCENERYANDWILSON,1996/2001;SINCLAIR,1991)toinvestigatetheso-called‘AngelinaJolieEffect’intheBrazilian context. In theBrazilian scenariogenetic counsellinghasonlybeenmadeaccessible to the National Unified Health System (SUS) in 2014 (BRASIL, 2014),havingbeenhighlycostlytomostofthepopulationbeforethatdate.Inthisrealm,ourgoalistoidentifythediscoursewhichemergesfromwidespreadwrittenmedia

82

inthecountryinthethreeyearsbeforeandafterthereferredphenomenon,namelyby contrasting a corpus of texts ranging from 2010 to 2012, and another onecovering the years of 2013 to 2016. The data was collected from Braziliannewspapers andmagazines, suchas FolhadeSãoPaulo, Estadão,OGlobo, Época,Istoé, taking into account the following keywords: ‘mastectomia’ [mastectomy],‘mastectomia preventiva’ [preventive mastectomy], ‘câncer de mama’ [breastcancer], ‘efeito Jolie’ [Jolieeffect], ‘aconselhamentogenético’ [geneticcounseling],‘geneBRC1’and‘geneBRC2’.ThetextsarebeingprocessedwiththeAntConc3.2.2toolkit (ANTHONY, 2011), focusing specifically on the concordances and on thecollocates.Thehypothesistheinvestigationstartsfromisthatpriortothe‘AngelinaJolie Effect’, breast cancer was related to a specific portion to the Brazilianpopulationonly,havinggainedanewsocialvoiceinthecommunityhenceforth.Assuch, being able to tackle and document theways inwhichwrittenmedia in thecountryexploresahealthissuewhichhasbeenaffecting56%oftheBrazilianfemalepopulation (INCA, 2015) is paramount, both as an attempt to understand theapproachesadoptedbypopularmeansofcommunication,aswellasacontributiontofuturepublichealthcampaignsinthecountry.

32

TERMINOLOGIAEMPRESARIAL:ORELATÓRIODESUSTENTABILIDADEEASLINGUAGENSESPECIALIZADAS

CarolinaR.Ourique

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

As empresas dos mais diversos segmentos de produção que utilizam recursosnaturais publicam Relatórios de Sustentabilidade com o propósito de demonstraraospúblicosdeinteresseoimpactodesuasatividadesnomeioambiente.Oobjetivodeste trabalho é caracterizar esse relatório como um texto de linguagemespecializadanoqualodiscursoseorganizaemtornodaterminologiaprototípicadeumaáreadeconhecimentoeatividade.Nessedirecionamento,busca-seapoionosreferenciais teóricos da Terminologia de perspectiva comunicativa (CABRÉ, 1999),para a qual o texto especializado é considerado uma realização da língua naturalcom características próprias de uma área temática, do objetivo e do modo deexpressão dos seus especialistas. Além disso, recorre-se aos princípios teórico-metodológicosdeperspectiva textual (CIAPUSCIO,1993)queconsideramos textoscomo objetos complexos que incluem diferentes níveis de análise: funcional,situacional,temáticoelingüístico.Adota-setambémaabordagemdaLinguísticadeCorpus(BERBERSARDINHA,2004)quepreconizaabuscadosignificadonocontextoreal da comunicação. Nesse quadro referencial, são analisadas amostras dediferentes relatórios em português e inglês, tendo como base os conceitos deadequação da perspectiva funcionalista dos atuais Estudos de Tradução (NORD,2009), segundo os quais não se traduzem elementos estruturais isolados de umtexto,masfunçõescomunicativasdependentesdosistemalingüístico,dasnormaseconvençõesespecíficasdecadacultura.Foiconstruídoumcorpusparalelocomposto

83

por três textos de empresas brasileiras redigidos e publicados originalmente emportuguês, alinhados paralelamente com suas respectivas traduções para o inglês.Os textos foram selecionados pelos seguintes critérios: constar no Guia deSustentabilidade(REVISTAEXAME,2015)comoempresasmaissustentáveisemseusrespectivos setores,estaremportuguêseestardisponibilizadoson-lineaopúblicoemgeral.Para iniciar, foramdestacadoseexaminadosmanualmenteoselementosconstitutivos damacroestrutura de cada documento. Em seguida, com assistênciadasferramentasinformatizadasdosoftwaredeanálisetextualAntConc(ANTHONY,2014), foramanalisadosospadrões léxicos,morfossintáticosepragmáticosatravésdasevidênciasfornecidaspelaslistasdeconcordânciasdaspalavrasmaisfrequentesno corpus,pelo levantamentodosagrupamentos lexicaismais significativosepeloexamedosdadosnocontexto.Nesta fase inicialdoprojeto, foipossível identificar,alguns dos elementos que configuram o caráter especializado dessas publicações.Comos resultadosdesseestudoexploratório,espera-seaprofundara identificaçãodoselementosqueconfiguramaespecializaçãodessetipotextualeassimcontribuiraomelhordesempenhoderedatoresetambémdetradutoresempresariais.

33

VOCABULÁRIOBILÍNGUEPORTUGUÊS/INGLÊSDELINGUÍSTICAGERAL:PADRONIZAÇÃODOSCORPORA

MárcioIssamuYamamotoUniversidadeFederaldeGoiás(UFG)

[email protected]

ALinguísticapassaaserdisciplinaministradanoscursosdeLetrasdasuniversidadesbrasileiras (BAGNO; RANGEL, 2005; CASTILHO, 2007) a partir dos anos 60. E,atualmente,hágrandescentrosquesededicamaoestudodestaáreanoBrasilcomproduçõesrelevantesanívelnacionaleinternacional.Apesardadifusãodadisciplinanaacademiabrasileirahámaisdemeioséculo,amaioriadosdicionáriosdisponíveis,parausodosacadêmicoseprofissionaisdaárea,sãolimitadosatraduçõesdeobrasestrangeiras, emgeral, ouobrasqueobjetivamaespecialistas, nãoa leigos. Logo,sem que haja o domínio na área conceitual e terminológica da Linguística, acompreensão desta disciplina é comprometida e até mesmo se torna impossívelparaosalunosingressantesemcursosdegraduação.Nointuitodesanarestafaltade material terminológico bilíngue nesta área, objetivamos desenvolver umvocabulárioterminológicobilíngue,português–inglêsnaáreadeLinguísticaGeral.Ametodologia adotada é a de Linguística de Corpus, por meio da qual, fazemos acompilação,processamentoeanálisedocorpusparaextraçãoda listadepalavras,palavras-chaveeacessoàslinhasdeconcordância.OconsoleusadoparaconfecçãodaslistasefasesdeprocessamentodoscorporaéoWordSmithTools6.0(WST6.0).As teorias que embasam a obra são: (1) a de Barbosa (1990) para o conceito devocabulário; adeCabré (1999) comaTeoriaComunicativadaTerminologia–TCT.Barbosa (1990) propõe que o vocabulário é o léxico de uma língua, cuja unidadeseriaovocábulo.Alémdovocábulo,concebidocomoumconjunto,inseridonoléxicode uma língua, também existiria o Conjunto Vocabulário ou Vocabulários das

84

Ciências,ovocabuláriodeespecialidades,conjuntoterminológicoouterminologia.Édentro dessa perspectiva que optamos por denominar o produto desse projetoVocabulário da Linguística e não Dicionário de Linguística. No que tange àTerminologia, a TCT de Cabré, (1990) propõe que a unidade lexical se caracterizacomotermodevidoaoscontextosnosquaiselaseinsere,tornando-seumaunidadeterminológica devido a aspectos pragmáticos que caracterizam a comunicaçãotécnico-científica.Ademais,aTCTconcebeotermocomoumaunidadeinseridaemumsistemalinguístico,ouseja,aunidadeterminológicaexistedentrodeumsistemamorfológico,fonológico,semânticoesintático.Osresultadosparciaisobtidossãooscorpora de aproximadamente 46 milhões de palavras e manuais de Linguísticacompiladosduranteaprimeirapartedoprojetocomdiscentesdagraduaçãoepós.NestemomentoestamostrabalhandonadigitalizaçãodemanuaisdeLinguísticaemportuguêseinglêsparacompletaraquantidadedepalavrasparaaconduçãofinaldaobraenapadronizaçãodoscorporajácompilados.

40

FLUÊNCIA E INTERAÇÃO NO INGLÊS PARA AVIAÇÃO: UMA ANÁLISEBASEADAEMPRAGMÁTICAELINGUÍSTICADECORPUS

MalilaPrado

UniversidadedeSãoPaulo(USP)

[email protected]

O inglês para aviação é um segmento do Inglês para Fins Específicos quemereceumaatençãoespecialdevidoàsuaimportâncianainteraçãoentreprofissionaisquelidam com segurança de voo. Assim, a Organização de Aviação Civil Internacional(OACI) exige que os governos signatários certifiquem a proficiência linguística eminglês de pilotos e controladores de tráfego aéreo para operações internacionais,respeitandoparâmetrospropostosemumaescaladeproficiêncialinguísticadivididaemseisníveis (de1,elementar,a6,expert),emseiscritériosdistintos (pronúncia,estrutura, vocabulário, fluência, compreensão e interação). Na tentativa decompreendermos se e como tais critérios são materializados em comunicaçõesradiotelefônicasautênticase,assim,buscarmosumaaproximaçãoentreoavaliado/ensinado e o real, propomos uma investigação por meio da correlação entre aPragmática e a Linguística de Corpus, ou Corpus Pragmatics (vide AIJMER,RÜHLEMANN, 2015). A junção dessas linhas de pesquisa possibilitou estudosvoltados à identificação dos elementos pragmáticos no contexto específico dacomunicação aeronáutica, em um corpus com 93 textos transcritos de situaçõesanormais envolvendo a interação entre os profissionais supracitados. Resultadospreliminaresevidenciaramaltapresençadedêiticos(sendoosmaiscomunswe,you,I,here, now), o honorífico sir emodalizações (can you,would you like), itens quepossibilitam estudos do quesito interação, uma das áreas linguísticas assinaladaspelaOACI.O outro campode interesse desta pesquisa, fluência, foi analisado pormeiodo levantamentodeexpressõesformulaicas (that´s,yessir,anduh)nabuscaporestratégiasdenominadasfluencemasprodutivos(GÖTZ,2013).Alémdisso,serádemonstradocomoousodetaiselementos,majoritariamenteutilizadosquandoa

85

troca de informações é sobre o problema em si, funcionam como uma divisãotransitória entre o inglês geral e a Fraseologia Aeronáutica. Concluiremos comamostras do corpus que justifiquem uma perspectiva mais ampla de avaliaçãolinguística, tal comoa competênciapragmática, atendendoaprincípios intrínsecosdesse tipo de comunicação utilizada internacionalmente por uma comunidadeprofissional.

41

ANÁLISE COMPARATIVA DAS ESCOLHAS LEXICAIS NA TRADUÇÃO DECONTOS EM LÍNGUA ALEMÃ: UM ESTUDO EXPLORATÓRIO SOB APERSPECTIVADALINGUÍSTICADECORPUS

LucianeLeipnitz,TamaraBelmonteMunichGraf UniversidadeFederaldaParaíba(UFPB)

[email protected]

Estetrabalhoapresentaumestudoexploratóriodasescolhaslexicaisnatraduçãodeumcontodalínguaalemãparaoportuguêsbrasileiroemdoismomentosdistintos:otexto traduzido por profissional não tradutor, e o texto final, fruto da revisão poralunos de graduação do Bacharelado em Tradução da UFPB. A revisão do textotraduzido constituiu-se em parceria acadêmica intrainstitucional, independente evoluntária, entre professores e graduandos em Tradução e visou unicamente àproduçãodeum texto finaldequalidadenapublicação, em línguaportuguesa,deum dos Contos de Aldeia de Berthold Auerbach do volume SchwarzwälderDorfgeschichten (1982). Pretende-se demonstrar que a formação específica emtradução, em oposição a crenças relacionadas ao tradutor e à tradução aindapresentes na visão geral sobre a atividade tradutória (ALVES, MAGALHÃES ePAGANO, 2003), compreende a aquisição de um conjunto de subcompetênciasespecíficas, que constituem a competência tradutória (PACTE, 2003), cujodesenvolvimento depende de orientações teoricamente embasadas e práticastradutórias reflexivas. O trabalho de revisão, desenvolvido ao longo do período2016.1, exigiu inicialmente a organização de um corpus alinhado texto original etexto traduzido, de modo que as dificuldades encontradas quando da revisãopudessemseresclarecidaspelaconsultaaotextodepartida.Comestabreveanálisecomparativa entre escolhas tradutórias pretende-se mostrar que uma práticatradutória reflexiva começa com um projeto de tradução, ao qual se agregamdiversas capacidades e habilidades, desenvolvidas ao longo de uma formaçãoacadêmica específica. Para a análise aqui apresentada, organizamos um corpusalinhadotextotraduzido-textorevisado,quechamaremosT1eT2,respectivamente,a partir do qual foi-nos possível realizar buscas com ferramentas online,sistematizandoobservaçõeslevantadasaolongodoprocessoderevisão.Àleituraemarcação de segmentos textuais com alterações substanciais do texto traduzidopara a versão final revisada seguiu-se a utilização da ferramenta AntConc, para ageração de listas de palavras e a comparação de escolhas lexicais. As primeirasobservações parecem revelar um texto com menor densidade lexical, maishomogêneo quanto a escolhas tradutórias, produzido em português brasileiro

86

padrão, sem marcas de regionalismos, mas ambientado em práticas e costumesalemãesdeoutrora.AsanálisesfazemusodemetodologiasdaLinguísticadeCorpusnabuscaporpeculiaridadesdetextosemlínguaportuguesa,produzidosporsujeitosdistintos, a partir de projetos tradutórios com objetivos diferentes, emboracomplementaresemsuafinalidade,pormeiodousodeferramentasdeapoioedaadoçãodediferentes estratégias para reexpressãona línguade chegada. Para darcontinuidade a este estudo exploratório, serão incorporados ao corpus outroscontos traduzidos a serem ainda revisados, de modo a subsidiar novas pesquisassobre o processo de aquisição da competência tradutória por meio de formaçãoespecíficaemTradução.

42

BUSCANDOAREPRESENTATIVIDADEDEUMCORPUSESPECIALIZADO

AnnaMariaMaciel,MárciaMouradaSilvaeRozaneRebechi UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

Napesquisalinguísticaaqualidadedeumcorpuspoderespelharousorealdalínguade dada população é uma questão que até agora parece não ter encontradoconsenso. Esta comunicação, gerada em pleno contexto da composição de umcorpusmultilínguedalinguagemdaconservaçãodedocumentosemsuportepapel,pretende discutir se hoje, quando se conta com inimagináveis recursos dainformáticaeprogressivosavançosdaciêncialinguística,aindaéválidaaafirmaçãode que a representatividade do corpus é um ato de fé antes que um fatocomprovado. Tendo como fundamentação teórica os ensinamentos dos pioneirosque abriramo caminho da atual pesquisa com corpora digitalizados, Leech (1991,2007),Biber (1993), entreoutros, apresentamosas linhasmestrasqueorientamaconstrução de um corpus multilíngue de textos contemporâneos de uma áreamultidisciplinar técnico-científica.Essecorpusdeveráseraprincipal ferramentadepesquisanatarefadeidentificaçãodeumrepertórioterminológicoaserregistradoemumglossárioon-line.Nessecontexto,osprincípiosbásicosdaoperacionalizaçãodo design do corpus são equacionados com as características do usuário dalinguagem a ser representada e com as características dos pesquisadores que autilizam,levandoemconsideração,alémdasespecificidadesdomododedizereospropósitos comunicativos, as condições acadêmicas e logísticas dos responsáveispelo projeto, sem esquecer desejos e necessidades daqueles que constituem opúblico preferencial do glossário a ser produzido. A construção do segmento docorpusemlínguainglesaencontra-seemandamentoeéofocodestacomunicação.Tal como a construção dos corpora das outras línguas estrangeiras, alemão,espanhol,francês,italianoerusso,foiprecedidapelolevantamentodapresençadedocumentosdaáreanaweb,oquerevelouamultiplicidadedeciênciase técnicasenvolvidaseadiversidadede tiposde texto,depublicaçõesedecomunidadesdeprofissionaisinteressados.Feitoodownload,ostextosforamexaminadoseaquelesque satisfizeram os critérios de representatividade à luz dos princípios pré-estabelecidos foram considerados relevantes e classificados em diferentes

87

categoriasantesdeserempré-processados,codificadosearmazenados.Oconjuntofoientãoexaminadoemrelaçãoàautoriacredenciadadostextos,àscondiçõesdeproduçãoerecepção,aobalanceamentodostiposeàrelevânciadaextensãoafimdeavaliarograumaioroumenorde representatividadedaamostragemcoletada.Ainda que estejamos em fase de construção do corpus, ousamos afirmar que arepresentatividadedeumcorpusespecializadoemnossosdiasjánãoéumatodefécego,masumcontinuumquenospermitecomprovaçãoenosfazavançarcadavezmaisemdireçãoaseualcance.

44

O QUE SIGNIFICA(VA) LOCALNO DISCURSO DOMOVIMENTO FARM-TO-TABLE?

StellaTagnin

UniversidadedeSãoPaulo(USP)

[email protected]

OmovimentoFarm-to-table(emportuguês‘docampoàmesa’)foiinspiradonolivroThe Omnivore’s Dilemma, deMichael Pollan (2006) e propagado por Dan Barber,chefamericano,comointuitodevalorizarospequenosagricultoresdaáreaondeselocaliza seu restaurante, Blue Hill at Stone Barns, em Pocantico Hills, N.Y. Seuobjetivoeraofereceraseusclientesprodutososmaisfrescospossíveis,garantindo,aomesmotempo,melhorqualidadedoalimento.Omovimentoteveinícioaoredorde2004(datadosprimeirostextos)eestende-seatéhoje.RecorrendoàLinguísticadeCorpus(Baker2006,Bakeretal.2008,Tagnin2013,)pretende-se,apartirdeumcorpusconstruídocomtextoseminglêsreferentesaessemovimentoepublicadosaolongodesseperíodo,investigareventuaisalteraçõesdesentidoqueascolocaçõescom o termo local, como local food, local produce, local farm(s), local farmer(s),entreoutras,possamtersofrido.Aescolharecaiusobrelocalportersidoapalavra-chavequeocorrecomomaiornúmerodecolocados.Afimde investigarsehouvealterações de sentido ao longo dos anos, o corpus foi subdividido por períodos:2004-2010(primeirosanos),2011-2014(augedomovimentoeumanovaorientação,apresentada por Dan Barber em 2014, no seu livro The Third Plate), 2015-2017(expansãoparaforadosEstadosUnidos).AferramentausadaparaainvestigaçãodocorpusfoioWordSmithTools,versão7(Scott2016).Foramanalisadasaslinhasdeconcordância das colocações com local, expandidas sempre que necessário paramelhor esclarecer o sentido. Por vezes, recorreu-se também ao texto todo,conformesugeremBakeretal(2008).Aanáliserevelouquealgunsrestaurantesseapropriaram do termo local passando a empregá-lo enganosamente, ou seja, osingredientesanunciados como ‘locais’ no cardápio,na realidadenãoeramobtidosdefontes‘locais’.Atribui-seessadeturpaçãodosentidoaumaapropriaçãoindevidadeconceitosdeummovimentodesucesso,sem,defato,fazerusodessesconceitos.Emoutras palavras uma apropriação apenas embenefício (leia-se ‘lucro’) próprio,contrariandotodaafilosofiadomovimentoFarm-to-table.

88

53

ÉPOSSÍVELFALAREMESTILODATRADUÇÃOEMLEGENDAGEM?UMAPESQUISABASEADAEMCORPUS

JanailtonMickVitordaSilvaeAlessandraRamosdeOliveiraHarden

UniversidadedeBrasília(UnB)

[email protected]

Estetrabalhobuscaapresentarapesquisademestradosobreatemáticadeestilodatraduçãono âmbito da legendagem, realizada no Programade Pós-Graduação emEstudos de Tradução da Universidade de Brasília (POSTRAD/UnB). Filiando-se aosEstudos da Tradução Baseados em Corpus (ETBC), a pesquisa tem, por objetivo,investigar estilo, seja como atributo pessoal ou atributo textual, na tradução delegendasoficiaisdefilmes.AnoçãodeestiloadotadaéadeBaker(2000),quedefineestilo do tradutor como uma impressão digital, descrevendo seu comportamentolinguístico a partir de padrões recorrentes, estatisticamente observáveis, queilustram uma preferência consistente por itens lexicais específicos, padrõessintáticos,recursoscoesivosouestilodepontuação,quandooutrasopçõesestariamigualmentedisponíveis na língua.Alémdisso, pretende-se construir umarcabouçoteóricoquedialoguepesquisasemestilodatraduçãoedotradutorliterário(BAKER,1999;2000;2004;2007;LEECH;SHORT,2007;MALMKJÆR,2003;2004;SALDANHA,2011a; 2011b) com a tradução para legendagem oficial (BOGUCKI, 2009; DÍAZCINTAS,2005a;DÍAZCINTAS;REMAEL,2007;GOTTLIEB,1994;1998;2005a;2005b;IVARSSON; CARROLL, 1998). Será construído um corpus paralelo (BAKER, 1995),composto por falas em inglês e suas respectivas traduções para o portuguêsbrasileiro, material esse extraído de cinco filmes domesmo gênero e legendadospelo(a)mesmo(a) tradutor(a) profissional nos últimos cinco anos. Para auxiliar nainvestigaçãodetraçosquepossamindicarestilo,serãoutilizadostrêsutilitáriosdoWordSmith Tools, versão 7.0 (SCOTT, 2017): i) Viewer & Aligner: alinhamento detextos fontes com textos alvos; ii)WordList: compilaçãode listas depalavras paraobter dados acerca da variedade lexical (razão forma/item e razão forma/itempadronizada),tamanhodostextos,númerodesentenças,entreoutros;iii)Concord:visualizaçãodepalavrasefrasesacompanhadasdocotextoemqueocorrem,apartirdebuscapornódulo(palavraseetiquetas).Apesardaslimitaçõesmetodológicasqueo estudo de estilo enfrenta no âmbito da tradução, como apontam as pesquisasnessaárea,busca-severificaraocorrênciadepadrõesestilísticosconsistenteseseesses padrões se verificam emmais de uma tradução do(a)mesmo(a) legendista,tentando, ainda, detectar se esses padrões podem ser atribuídos a(o) tradutor(a),levandoàelaboraçãodeumperfilestilísticoindividual,ouàstraduções.Intenciona-se, por fim, contribuir para uma epistemologia de campo, suscitandoquestionamentosacercadapossibilidadedoestudodeestiloemlegendagem,comoatributopessoaloutextual.

89

54

UTILIZANDOCORPORANAPESQUISADATERMINOLOGIADEGÊNERONALEGISLAÇÃOBRASILEIRA

ClarissaIsabelV.deOliveira

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

Este trabalho em andamento se insere na pesquisa do reconhecimento daterminologia referenteàsquestõesdegêneronos textos legislativosbrasileirosdeâmbito federal e do Rio Grande do Sul. Definimos essa terminologia como itenslexicaisrelacionadosàsmulhereseàspessoasLGBT,bemcomoaoscontextossociaise jurídicos quemotivama produção legislativa voltada a esses sujeitos de direito.Considerando a Terminologia como janela para compreensão do mundo,objetivamos, em nossa apresentação, demonstrar que em corpora de textoslegislativosencontramos registros terminológicosde transformações sociais.Pontocentral de nosso estudo é o termo de natureza categorial “gênero”. Partimos dosuposto de que ao redor desse termo gravitam os termos distribuídos em áreastemáticas tais como trabalho, violência e direitos reprodutivos. Nossa abordagemrelaciona-secomaSemânticadeFrames,segundoaqualoprocessodepareamentodeumapalavracomseuframesubjacenterequerquesereconheçaarelevânciadainformação subjacente dentro da qual essa palavra desempenha um papelinterpretativo. (FILLMORE; BAKER, 2009, p. 317-318.) Em nosso estudo, essaperspectivadialogacomaTeoriaSociocognitivadaTerminologia(TST),quetrataostermos como unidades de compreensão (u.c.), as quais funcionam em modeloscognitivoseevoluemconstantementeporquestõessócio-históricas(TEMMERMAN,2004, p. 35.), correspondendo ao caráter sociológico de nosso objeto.Metodologicamente, utilizamos corpora numa abordagem interdiscursiva.Constituímos um corpus de estudo (corpus A) composto de 90 textos legislativosrelacionados às questões de gênero, e, como apoio para compreender oconhecimento subjacente às u.c. observadas no corpus A, um corpus subsidiário(corpusB), compostode textosde referência,depopularizaçãoe científicos sobrequestões de gênero, os quais assumimos como representativos da área e comoinfluenciadores de conteúdo dos textos legislativos. Para compor o corpus B,consideramos,conformeSinclair(2004),quetextosdeteóricosreconhecidosoudefontesoficiaisconstituemcritérioderepresentaçãoexterna.Identificamosnocorpusde textos legislativos candidatos a u.c., cujos critérios de seleção são, até omomento: termos que façam referência aos sujeitos de direitos (e.g. vítimas deviolência sexual, que designa o sujeito de direito mulher), aos seus direitos (e.gespaçodeescuta)eafatoresmotivadoresdedireitos(e.g.feminicídio).NocorpusB,comauxíliodosoftwareAntConc,observamosconcordânciasparaotermo“gênero”comonódulodebuscadoselementoslinguísticosqueintegramaestruturadoframeGÊNERO. O uso de corpora nos possibilita, como resultados preliminares: 1)constataraocorrênciadevariaçãosemânticanostextoslegislativos–aumamesmaformalexicalcorrespondemumau.c.denaturezacategorialeumau.c.denaturezaconceitualcomfunçãoidentitária;2)identificaraestruturadoframeGÊNERO,cujos

90

elementossão,entreoutros,mulheres,pessoasLGBT,homenseEstado,nopapeldeparticipantes, e trabalho, violênciaediscriminaçãonopapeldeacessórios; e alémdisso, 3) demonstrar a importância comunicativa (SINCLAIR, 2004) do corpussubsidiárionabuscadaplenacompreensãodasu.c.,dadaaausênciadedefiniçãodotermo“gênero”nocorpusA.

56

O CÂNCER DE MAMA EM PALAVRAS: UM ESTUDO DE CORPUS NASINTERFACESLINGUÍSTICA,INFORMÁTICAESAÚDE

AlineAverVanineAnaRachelSalgado

UniversidadeFederaldeCiênciasdaSaúdedePortoAlegre(UFCSPA)

[email protected],[email protected]

Apropostadeste trabalhoédetalhara construçãoea consolidaçãodeumcorpustemático a respeito do câncer de mama a partir do diálogo entre as áreas daLinguística, da Informática e da Saúde. O foco do corpus são textos do gênero“depoimento escrito”, elaborados por mulheres acometidas por esse tipo deneoplasia, ou em processo de cura, publicados virtualmente em blogs. Esses sãocoletados e organizados de forma a possibilitar a sua utilização em estudos queenvolvam educação para saúde, comunicação entre profissionais da saúde epacientes,aumentodeconsciênciametalinguística,usoeconstruçãodeferramentasde análise linguística, entre outros. Assim, serão explicitados os fatores queinfluenciam a escolha de determinados blogs, os elementos de organização epadronização do corpus, as técnicas e ferramentas utilizadas (tais comoconcordanciadores e analisadores automáticos), bem comoas possíveis aplicaçõesdessesdadosnainterfaceproposta.Umcorpusderelatosdeexperiênciapoderáserutilizado,porexemplo,emanáliseslinguísticaspropriamenteditas,comoaavaliaçãodemetáforasemetonímiasconceptuais(Pragglejaz;Seminoetal.2015)emergentesno discurso; em atividades ligadas à formação de profissionais da área da saúde(Mitreetal.2008;Berbel,2011),porampliaraconsciênciasobrea importânciadaatenção ao discurso ligado a relatos de experiência da expressão de percepçõesfísicasepsíquicas;paradiscussõesacercadacomunicaçãodoprofissionaldasaúdecom a equipe e com o paciente, enfocando as diferenças existentes entre acomunicação especializada, a semiespecializada e a não especializada; e paraconscientizaro(futuro)profissionaldesaúdesobrea importânciadeumaescutaede um diálogo empáticos com seu paciente, de modo a apoiar a construção devaloreséticosnaformaçãodoprofissionaldesaúdeeemsuaatuaçãofutura.

91

57

AMODALIZAÇÃOAVALIATIVAEMRESUMOSCIENTÍFICOS:UMESTUDODALÍNGUAESPANHOLACOMBASEEMCORPUS

MaurenThiemyItoCeresereSandraDiasLoguercio

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected],[email protected]

O presente estudo faz parte de um trabalho maior que analisa e descreve ofuncionamentodosmodalizadoresdemaneiracontrastivaemtextoscientíficosemlíngua portuguesa, espanhola e francesa para fins pedagógicos e/ou de auxílio àtradução. A modalização pode ser compreendida como uma estratégiaargumentativaemqueo locutorassumeumposicionamentoperanteoenunciado,imprimindoumaavaliaçãooupontodevistasobreoqueédito(Nascimento&Lima,2012). Esseposicionamento, segundoCastilho (2010)eNascimentoe Lima (2012),pode ser expresso de três maneiras: i. pela modalização epistêmica (em que oconteúdoproposicionaléavaliadoemrelaçãoaseuvalordeverdade); ii.deôntica(em que o conteúdo proposicional é entendido como um estado de coisasobrigatório, necessário ou possível); iii. avaliativa ou afetiva (em que há umjulgamento de valor em relação ao conteúdo proposicional). Textualmente, osmodalizadoressãomarcadoslexicale/oumorfologicamente,pelousodeincisas,pormarcas tipográficas ou prosódicas (Kerbrat-Orecchioni, 1980); podem aparecer demodomaisexplícito (comonasmodalidades frasais,emverbosquedenotamumaoperaçãológica,etc.)ouestaremincorporadosaodito(empregodecertostemposverbais,usodeadjetivosouadvérbios,porexemplo).Paraesteestudo,analisaram-se resumos da área de Linguística a partir de corpora em português e espanholcompostospor100textos,enfocando-seespecificamenteamodalizaçãoavaliativa,expressa sobretudo por adjetivos e/ou advérbios. Esse tipo de modalização, porevidenciarjulgamentosdevalore,dessemodo,revelarumsentimentodolocutor,éomenosprovávelnodiscursocientíficoouaquelequesebuscaevitar,emnomedorigor e da busca pela imparcialidade da ciência. Porém, qualificações como“importante”, “relevante”, “valioso”, entre outras, também integram tal discurso,queéconstruídodemodoaobteraadesãodo leitor.Aanálisepropostasedivideem três etapas: i. familiarização com os resumos (estudo da macroestrutura eidentificação de índices demodalização); ii. extração automatizada de informaçãolinguística com uso do programa AntConc (versão 3.4.4, especialmente dasferramentas Concordance e Wordlist); iii. análise e contraste dos modalizadoresavaliativos frequentes nas línguas abordadas. Os resultados preliminares indicamqueessetipodemodalizaçãoocorremaisfrequentementeemresumosproduzidosemlínguaespanhola,sendomaisrarosemresumosescritosemlínguaportuguesa.

92

59

O PROCESSO DE ORGANIZAÇÃO E ETIQUETAGEM DO CORPUSLINGUÍSTICO“UFSM”

SabrinaDamiani UniversidadeFederaldeSantaMaria(UFSM)

[email protected]

Comafinalidadederesponderàsdemandasempesquisasnosníveisdegraduaçãoepós-graduação dos cursos de Letras da UFSM, em especial às investigaçõesdesenvolvidas na área de Linguística Sistêmico-Funcional (HALLIDAY, 1994, 2004;HALLIDAY;MATTHIESSEN,1999,2004,2014),especialmenteemlínguaportuguesa,procedemos,comoauxíliodaferramentacomputacionalWordSmithTools(SCOTT,2009),àcoletaeorganizaçãodeumcorpusquedenominamos“CorpusLinguísticoUFSM”.Nossoobjetivoprincipalécomporumcorpusdetextosdecunhoacadêmico,jornalísticoepolítico,quesãoosmaisinvestigadospelalinhadepesquisaLinguagemno Contexto Social à qual este trabalho está vinculado. Os textos de cunhojornalísticoepolíticoforamescolhidosporseremdoisgênerosestudadosporMartin&Rose(2008),jáostextosdeacadêmicosforamescolhidospelospesquisadoresdeLinguagemnoContextoSocial,poistrata-sedeumgêneroaindapoucoexploradonaLSF.Inicialmenterealizamosacoletadostextosemsitesdamídia(jornaisdocentrodo país e também do Rio Grande do Sul) e de instituições políticas (site daPresidênciadaRepública,BibliotecadoCongressoNacional, páginasespecíficasderepresentantespolíticosnoBrasil)euniversitária (especialmentedecursosdepós-graduação), os quais foram devidamente separados em três blocos (acadêmico,jornalístico e político). Posteriormente, para cada bloco foram criadas subpastas,seguindo o critério da divisão por gêneros textuais (MARTIN; ROSE, 2008, ROSE;MARTIN, 2012). Até o momento coletamos 500 textos que constituem o corpusformadopormaisde1.000.000de tokens. Emum terceiromomento,passamosàfasedeetiquetagem,oqueestamosrealizandocomoauxíliodoetiquetadoronlineVISL (Visual Interactive Syntax Learning), desenvolvido por pesquisadoresdinamarqueses (SARDINHA, 2004). Como o corpus precisa ser constantementealimentando, traçamos como meta, até o final de 2017, reunir um total de 800textos devidamente etiquetados, de modo a prover suporte aos trabalhosdesenvolvidosemanálisesdediscursopelospesquisadoresdoscursosdeLetrasdaUniversidade Federal de SantaMaria. Também é nosso objetivo socializar nossasinvestigações,demodoatornarestacoletâneadisponívelnainternet,afimdequeseja utilizada por usuários interessados no trabalho com textos das três áreasapontadas.

93

60

ESPECIFICIDADESDOVOCABULÁRIODAOBRACONTOSGAUCHESCOS,DESIMÕESLOPESNETO:UMESTUDOEXPLORATÓRIO

NathaliaMarconeMariaJoséFinatto

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected],[email protected]

INTRODUÇÃO:Oobjetivodestetrabalhoéapresentarumaanáliseinicial,comapoiode recursos da Linguística de Corpus, do vocabulário empregado na obra literáriaContosGauchescos(1912)deSimõesLopesNeto(1865-1916),importanteautordaliteratura sul-riograndense, vistoqueoacessodesse livro tendea ser consideradocomo bastante difícil para leitores atuais (conforme FISCHER, 2000, p.7-8). Aodescrever o vocabulário da obra, apontam-se possíveis especificidades do gêneroliterário e do autor frente a autores seus contemporâneos (em um corpus decontraste)e frenteadois corporagerais,não literários,umdomesmoperíododaproduçãodaobraeumcorpusatualdoportuguêsbrasileiro(corporadereferência).MATERIAIS E MÉTODOS: A observação do vocabulário empregou a ferramentaAntConc3.4.1m.medianteosrecursoslistadepalavras,relaçãotypes/tokenselistade palavras-chave. O livro Contos Gauchescos apresenta 32.879 tokens e 6.428types;eteveseuvocabuláriocontratastadocomaquelesdasseguintesobras:TristeFim de Policarpo Quaresma (1915): 66.683 tokens e 10.713 types, Os Sertões(1902)6: 154.735 tokense22.134 typese Iracema (1865)1: 29.898 tokense5.563types; como corpora de referência utilizamos: (a) cartas de diferentes remetentesescritas entre os anos de 1800 e 18995, disponíveis no Corpus Histórico doPortuguês Tycho Brahe; (b) listas de palavras (da escrita e da fala) do Banco dePortuguês. Inicialmente, foramfeitas listasdepalavrasdoscorporadeestudoedecontraste.Emseguida,foicriadaumakeywordlist,contrastandoessesdoiscorpora.Dessa lista,asprimeiras1750palavras (31%)11foramcomparadascomoscorporadecontrasteedereferência,identificando-seositensdefrequênciazeroemambososcorpora.RESULTADOSPARCIAIS:Osresultadosdatabela1sugeremqueotextodosContosGauchescosnãopossuiumagranderiquezalexical,masécompostoporvocábulos específicos: os 5.647 vocábulos da keyword list, que representam aspalavrascujafrequênciaéestatisticamentediferenteentreoscorporadeestudoede contraste, correspondem a 87,8% dos types do corpus de estudo. Essa idéia éreforçadapelos resultadosda tabela2,quedestacaaquantidadedevocábulosdefrequênciazeronacomparaçãoentreoscorpora.Aanáliserealizadanãopretendeuesgotar a investigação sobre a especificidade lexical encontrada, merecendo opresente trabalhoummaior aprofudamento. Identificamos, por exemplo, palavrascomo 'china’, que, embora conste na lista de palavras do corpus de referência, éplausível supor-se que com significado diverso daquele empregado por S. LopesNeto,asaber:mulher,especialmenteamestiçaouaíndia.Assim,apossibilidadedelematizaçãoeanálisesemânticadosvocábulosdevemserlevadasemconsideraçãoemumaanálisefutura.

94

63

PESQUISALINGUÍSTICACOMCORPORAEMEMÓRIASDETRADUÇÃO

LianaParaguassu

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

Este trabalho visa a demonstrar de que forma as memórias de tradução (MTs),gerenciadaspelasCATTools(ComputerAssistedTranslationTools),podemajudarotradutorqueadotaaabordagemmetodológicadapesquisalinguísticacomcorpuseospressupostosfundamentaisdosEstudosdeTraduçãoedaTerminologia,arealizarumtrabalhomaiseficaz.AsMTssãoumabasededadosquearmazenaosdadosdotexto fonte a ser traduzido e do texto alvo já traduzido, nos pares de idiomas detrabalho, em segmentos paralelamente alinhados, formando, assim, um corpusparalelo(KAWAMORITA&CASELI,.2012;NOGUEIRA,2012).AsCATToolstrabalhamcomumalgoritmodecorrespondência;estealgoritmoécapazdereconhecerseossegmentosdeumtextoasertraduzidocorrespondemtotalmente(100%match)ouparcialmente (fuzzy match) aos dados de textos já traduzidos e armazenadosanteriormente na MT. O principal objetivo das MTs e das CATs é aumentar orendimento do tradutor pormeio da reciclagemde textos já traduzidos, gerando,com isso,umasignificativaeconomiaparaasempresasquecontratamserviçosdetradução. Contudo, essas ferramentas, sozinhas, não são capazes de auxiliar otradutornabuscaporequivalentestradutórios,porissoaimportânciadeotradutortambém utilizar outros corpora para aprimorar seu trabalho e procurar subsídiospara um equivalente tradutório mais adequado. Sendo assim, concluímos que éprecisoqueotradutorsaibadesenvolver,juntamentecomacompetênciatradutórianos pares de idioma de trabalho,mais uma relativa competência informática e oconhecimentoteóricoeaplicadodapesquisalinguísticacomcorpus(FREROT,2016;GARCIA,2015). Este trabalhoemandamento temporobjetivodemonstrardequeformaasmemóriasdetraduçãoeasCATToolspodemtrabalharemconjuntocomferramentas de linguística de corpus para ajudar o tradutor nesse processo. Paratanto, exemplificaremos como utilizamos um corpus de textos de mecânica,especificamentedemotores, armazenadonamemória de traduçãoda ferramentaSDL Trados Studio 2017 para decidir sobre um equivalente tradutório. O primeiropassofoiaplicarasdiferentesferramentasdosoftwareAntConcnocorpusparalelodo Trados Studio para definir quais palavras mais se destacavam. Em seguida,selecionamos crankshaft como termo de trabalho por este apresentar diferentestraduções (virabrequim, girabrequim, eixodemanivelas) paraomesmo termoeminglêseparadesignaramesmapeçadomotor.Após,utilizamosaferramentaSketchEngineparaanalisarasocorrênciasdessestermosemumcorpusdereferênciaemlínguaportuguesaecompará-lascomnossosdados.Averificaçãodesuafrequênciajuntamentecomopadrãodecomportamentolexicalnosfezoptarporvibrabrequimcomooequivalentetradutóriomaisadequado.Comisso,concluímosaimportânciadapesquisacomcorporapelotradutor,emparaleloaousodasMTs,demodoqueelepossadefinirqualtermodeveserutilizadocomotraduçãonalínguadechegada,umavezqueouniversodasmemóriasdetraduçãoémuitomenosrepresentativodo

95

uso real de um termo do que aquele dos corpora de grandes proporçõesencontradosnaweb.

64

ANALISANDOPACOTESLEXICAISEMUMCORPUSMULTINACIONALDEPORTUGUÊSACADÊMICO

TanaraZinganoKuhn,JoséPedroFerreiraeMargaritaCorreia

UniversityofLisbon/CELGA-ILTEC,UniversityofCoimbra

[email protected],[email protected],[email protected]

Vários estudos demonstram que os pacotes lexicais (lexical bundles), entendidoscomosequênciasrecorrentesdepalavras,normalmenteincompletasesemcaráteridiomático,variamconformeoregistroemquesãoempregados(Biberetal.1999;Biber,2009).Assim,quandousadosemtextosacadêmicos,ospacotesapresentamdiferentes formas, padrões, frequências e funções que permitem, de um lado,distinguir esse registro de outros (Biber et al. 1999; Biber, 2006), e, de outro,contribuir para a diferenciação entre gêneros (Hyland, 2008), disciplinas(Biber&Barbieri, 2007) e modo oral ou escrito (Biber, 2009). Embora a grandemaioria dos estudos sobre os usos de pacotes lexicais no âmbito acadêmico digarespeitoàlínguainglesa,revisãobibliográficaindicaqueessetópicotemsidoalvodeinteresse crescente também no que tange ao português acadêmico (Kilian &Loguercio, 2015). Nesse sentido, o trabalho em desenvolvimento que aqui seapresentapretendecontribuirparaessecampoatravésdeumestudoexploratórioacerca do uso de pacotes lexicais (cf. Biber et al., 2004) no Corpus de PortuguêsEscrito em Periódicos (CoPEP) (Kuhn &Ferreira, 2016), que contém cerca de 40milhões de palavras, abrange seis grandes áreas do conhecimento e é equilibradoentre as variedades português brasileiro (PB) e europeu (PE). Baseando-nos nosestudosdeBiberetal.(2004),Biberetal.(2007)eSardinhaetal.(2015),propomosumapesquisadivididaemtrêsetapas.AprimeiratemcomoobjetivosidentificarospacoteslexicaisformadosporquatropalavrasqueocorremnoCoPEP,observarseuspadrõesestruturaisdeformaacategorizá-losemdiferentestiposformaiseapontarsua distribuição em termos de áreas de conhecimento e variedades PB e PE. Já asegunda fase diz respeito ao desenvolvimento de uma taxonomia das funçõesdiscursivas dos pacotes lexicais encontrados no CoPEP e descrição de suadistribuiçãono corpus. Por fim, a terceira etapa consiste emanalisar e discutir osresultados, tendo em vista os aspectos formais e funcionais dos pacotes lexicais,verificandoseestescontribuemparaacaracterizaçãodetextosacadêmicosescritosem PE e PB e no escopo das diferentes áreas de conhecimento. Pretendemosenriqueceressadiscussãoaocotejarmosnossosresultadoscomaquelesobtidosemoutrosestudoscomomesmoobjeto,salvaguardando,evidentemente,asdiferençasdeâmbitometodológico.Entreestes,destacamosaquia investigaçãodesenvolvidaporSardinhaetal.(2015,p.56),que,adotandoataxonomiadefunçõesdospacoteslexicaispropostaporBiberetal. (2006)),apontouaexpressãode referênciacomosendoafunçãomaisfrequentedospacoteslexicaisemartigoscientíficosescritosemPB. Outro importante estudo a ser usado para fins comparativos é o de Bennett

96

(2010), no qual a autora constata que textos acadêmicos escritos em PE, aocontrário daqueles escritos em inglês, tendem a apresentar observações eafirmações de forma indireta, subordinadas a orações principais que enfatizam adimensão interpessoal (Bennett, 2010, p.25), normalmente formando estruturasexcessivamenteelaboradas(e.g.“nãodeixadeserinteressantenotarque”).Comointuitodecontribuirparaosestudosacercadoportuguêsacadêmico,traremosaquialgunsresultados,aindaquepreliminares,denossapesquisa.

69

O USO DE CORPUS NO DESENVOLVIMENTO DE DICIONÁRIOSELETRÔNICOSORGANIZADOSAPARTIRDANOÇÃODEFRAME

BrunadaSilva

UniversidadedoValedoRiodosSinos(UNISINOS)

[email protected]

ASemânticadeFrameséumateoriadebaseempíricaquedefendequesomenteépossível compreender o significado de uma palavra ao relacioná-la a um sistemaestruturadodeconhecimento,ouseja,aumframe.Estetrabalho,queseinserenainterface entre Semântica de Frames (FILLMORE, 1982;1985) e LexicografiaEletrônica, tem como objetivo investigar a contribuição do uso de corpus nodesenvolvimentodedicionárioseletrônicosorganizadosapartirdanoçãodeframe,visto que tanto a Semântica de Frames quanto a Lexicografia preveem em suasmetodologiasdetrabalhoautilizaçãodedadosprovenientesdecorpuscomoformadeacessoaevidênciasempíricas sobreosusos linguísticos.Ametodologia incluiaanálisedoDicionárioOlímpico(CHISHMAN,2016),produtodesenvolvidopelogrupodepesquisaSemanTec,daUnisinos,quedescreveosframes(cenários)decadaumadasmodalidadesolímpicaseapresentasuasrespectivasunidadeslexicais(palavras).Asunidadeslexicaisdodicionário,assimcomoseusequivalentesdetraduçãoparaalínguainglesaeosexemplosemlínguainglesaprovêmdecorporacompiladosparaservir a tal finalidade. Os objetivos metodológicos incluem identificar em quemedidaoscorporaforamutilizadoseparaquaisfinalidadesseuusoestavavoltado.Cumpridos os objetivos, pretende-se avaliar de que modo esses resultadoscontribuírampara o produto final. Embora a relação entre lexicografia impressa euso de corpus não seja algo novo (considerando-se os muitos aspectos que esseempregoatendenacriaçãodeumdicionáriotradicional,taiscomofornecerlistadepalavras,equivalentesdetradução,exemplosetc.),aLexicografiaEletrônica(nessecaso,aliadaàSemânticadeFrames)abreumasériedepossibilidadesparaousodeevidências provenientes de corpus no desenvolvimento de dicionários. As maisimportantes dessas possibilidades se relacionam a (i) mostrar conexões entresignificadosepadrõesdeusoe(ii)identificaroscontextosnosquaisaspalavrassãoutilizadas.Otrabalhoestáemfasededesenvolvimento.Palavras-chave:SemânticadeFrames.LexicografiaEletrônica.LinguísticadeCorpus.

97

75

A CORPUS ANALYSIS OF THE VOCABULARY FROM BEYONCÉ’SLEMONADE

NatashaBarthSidorukeAlineXavierdeVargas

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected],[email protected]

Lemonade(2016)isBeyoncé’slatestalbum.Itisdifferentfromherpreviousworkinthatitaddressesthemesthathadnotbeenencompassedbytheartistbefore,suchasabusiverelationshipsandracialandgenderinequality.Inordertodetermineifthechange in theme affected the vocabulary used in the lyrics, two corpora werecompiled:(i)thereferencecorpus,whichcorrespondedtoherpreviousalbums,and(ii) the study corpus, which contained Lemonade’s song lyrics. The keyword listrevealed significant differences between the two corpora. Four vocabularycategoriesweresetoutinLemonade’skeywordlist,relatedtothecentralsubjectsofthealbum.

76

QUANDO A GLOBALIZAÇÃO AFLIGE: UM ESTUDO CONTEMPORÂNEODAS VARIEDADES FONÉTICO-FONOLÓGICAS EM LÍNGUA INGLESABASEADOEMCORPUS

AdeilsondeJesusOliveiraJúnior UniversidadedoEstadodaBahia–CampusXIV.ConceiçãodoCoité,BA

[email protected]

The purpose of this paper is to investigate through analysis based on CorpusLinguistics, some differences that arise in phonetics of the English Language. Weaimed topresent abrief theoretical reviewof theEnglish languagehistoryand its“status”, considering the changes that occur mainly with the expansion of theEnglish language in globalizing processes. It is our aim to consider the analyzescompiledfromonlineCorporasuchasVOICE,theViennaUniversity,coordinatedbytheresearcherBarbaraSeidlhofer.

98

81

ARTIGOS CIENTÍFICOS SOBRE TRANSTORNO DO ESTRESSE PÓS-TRAUMÁTICO: DESAFIOS DA ACESSIBILIDADE LINGUÍSTICA PARAPÚBLICOLEIGO

AsafeDaviCortinaSilva

ProgramadePós-GraduaçãodoDepartamentodeLetrasdaUniversidadeFederaldoRioGrandedoSul–UFRGS

[email protected]

O presente trabalho descreve o estudo-piloto de um projeto de dissertação cujoprincipalobjetivoéanalisaracomplexidadedeartigoscientíficossobreoTranstornodo Estresse Pós-Traumático, tanto em Português como em Inglês, para investigarcaracterísticas textuais que possam aumentar ou reduzir a complexidade de umtexto.Umavezqueesseprojeto seencontraemseuspassos iniciais,eledescreveapenasaanálisedealgumasmétricasespecíficasesuaspossíveisindicações.

84

ATIVIDADES DE COMPREENSÃO ORAL COM BASE EM CORPORA: UMESTUDOPILOTO

LucianoF.daSilva,PaulaT.PintoeElenDias

Universidade Estadual Júlio de Mesquita Filho; Universidade Estadual Júlio de Mesquita Filho(UNESP–IBILCE);FaculdadedeTecnologiadeJales–FATEC

[email protected],[email protected],[email protected]

O presente artigo é um recorte de uma pesquisa de mestrado que tem comoobjetivoacriaçãodeatividadescombaseemcorpora,voltadasaodesenvolvimentodacompreensãooralparaalunosemnívelA2eB1.Paratanto,foramutilizadososconceitos da Linguística de Corpus [O'Keeffe, McCarthy e Carter 2007; BerberSardinha2004eSinclair2004],alémdeInglêsparaFinsAcadêmicos[Charles2013eFlowerdew2001]eDesenvolvimentodaCompreensãoOralemLínguaInglesa[Goh2012; Buck 2011 e Rost 2011]. Como embasamento teórico-metodológico paraelaborarasatividadesqueserãoapresentadasemumminicursoministradoemumainstituição de ensino superior no noroeste do estado de São Paulo. As atividadesforamcriadascombaseemdoiscorporacompiladosapartirdeapresentaçõesoraisdoTEDTalkseTED-Ed.

99

85

O USO DE CORPORA MULTIMODAIS NA CONSTRUÇÃO DE UMDICIONÁRIOBASEADONANOÇÃODEFRAMESSEMÂNTICOS

SandradeOliveira

UniversidadedoValedoRiodosSinos(UNISINOS)

[email protected]

Vinculado ao projeto Dicionário Modalidades Olímpicas 2016 (CHISHMAN, 2015),cujo propósito foi criar um dicionário de termos olímpicos em português e inglêsbaseadonanoçãode framessemânticos (FILLMORE,1982),esteestudotemcomotemaoprocessodecoletadoscorporaemportuguêsqueforneceramosdadosparaa construçãodos frames relativos aos esportes olímpicos. Justifica-se pelo fato defornecerdadosque contribuemparaa construçãodeumdicionárioqueauxilie aspessoas no processo de construção dos sentidos das palavras desses domínioslexicais.Oobjetivodeste trabalhoédiscutir como sedeuesseprocessode coletados corpora: seleção e armazenamento dos textos. A metodologia se apoiou nateoria semântica de Fillmore e fez uso do software AntConc como recurso deexploraçãodoscorpora.Consistiunacoletadetextosdogêneromatchreports,querelatam as ações desempenhadas dentro dos esportes. Foi efetuada a seleção desites e registrados em uma tabela de links para otimizar omomento da coleta. Apartirda tabela,asnotíciasdecadasite foramexaminadaseasqueatendiamaoscritérios foramselecionadas.Omododearmazenamento consistiuemsalvar cadatexto individualmente em formato .txt, codificação UTF-8, ignorando informaçõesque não faziam parte do relato, como imagens e comentários. Os resultadosapontam para o fato de que os critérios de seleção dos textos não puderam serseguidosàrisca,umavezquefazempartedasmodalidadesolímpicasesportesquenãopossuemnenhumtipodenarração,sejaporconsistirememaçõessimplificadas,comopartidaechegada,oupornãoseremdifundidosnoBrasil.Assim,aadoçãodosgêneros multimodais foi necessária, como foi o caso do Rugby 7s e de outrosesportes.Recorreu-seamanuaisderegrasoficiais,textosdidáticosdisponibilizadosporsitesdasconfederaçõeseporprofissionaisdaárea.Aleituradessestextos,alémdacoletadasunidadeslexicaisdecadamodalidade,possibilitouacompreensãodadinâmica dos esportes. Isso permitiu a construção de mapas conceituais queorganizaram as informações enciclopédicas de cada esporte e facilitaram aidentificação dos seus eventos (frames). Como complemento, foram assistidaspartidasdoCampeonatoMundialedoSulamericanonarradasemportuguês,tantono YouTube como em canais da TV aberta, nos quais, ao serem identificados osframes,foramtranscritasassentençasqueevidenciamoselementospertencentesaesse frame e seus relacionamentos. Enfim, a partir desses corpora, através dosoftwareAntConc,foramextraídastodasasunidadeslexicaiseas informaçõesquepossibilitaram a definição dos cenários do Dicionário Olímpico. As estratégiasutilizadaspossibilitaramquetodasasinformaçõespresentesnoDicionárioOlímpicotenhamsidoobtidasdetextosextraídosdomundoreal,oquevemaoencontrodoposicionamentodaSemânticadeFramese,deformageral,daLinguísticaCognitiva.

100

87

O USO DE CORPUS PARALELO E COMPARÁVEL PARA DESCREVERPADRÕESDEUSONATRADUÇÃODEABREVIATURASEACRÔNIMOSDETERMOSMÉDICOS

MárciaMouradaSilva,GabrielePaparellieGislaineAlves

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

Basta uma busca pelas dissertações e teses defendidas nos programas de pós-graduaçãodasuniversidadesbrasileirasparaseconstatarqueemboraaspesquisascom tradução de textos médicos tenham aumentado nos últimos anos, ainda hápoucointeresseacadêmicoeminvestigarasescolhastradutóriasparaabreviaturaseacrônimos,elementosrecorrentesnessestextos.Aindaquehaja,comonos lembraAixelá (2009), certa disposição em manter abreviaturas inalteradas em textostraduzidosdoinglêsparamanterocaráterdedadadisciplinaefacilitaradivulgaçãodoconhecimentotécnico-científico,apráticanosmostraqueesseselementosestãolongedeseremestanquesequetampoucoháconsensoemrelaçãoacomotraduzi-los, o que acaba por dificultar o trabalho do tradutor. Como grande parte dadivulgaçãodoconhecimentotécnico-científicoéfeitaemlínguainglesa,atraduçãodeartigosmédicosparaessalínguavemsetornandoimprescindível.Assimsendo,oobjetivo desta pesquisa é verificar o comportamento tradutório em relação aabreviaturaseacrônimosnopar linguísticoportuguês-inglêsepropôrumglossárioon-linequesirvacomofontedepesquisaparatradutoresemformação,tradutoresprofissionais, redatores e revisores. Além da tradução técnico-científica (AZENHA,1996 e 1999; AIXELÁ, 2009; AUBERT, 2001), a pesquisa tem comobase teórica osEstudos da Tradução baseados em corpus (BAKER, 1993 e 1995; OLOHAN, 2004;TYMOCZKO,1998),queemprestamdaLinguísticadeCorpus(BAKER,2013;BERBERSARDINHA, 2002 e 2004; LEECH, 1991; TOGNINI-BONELLI, 2001) alguns de seusprincípios e algumas das técnicas por ela desenvolvidas, sobretudo no que dizrespeito à metodologia de compilação de corpus. A pesquisa se apoiará nacompilação de três corpora: i) corpus paralelo com textos originais em línguaportuguesaesuastraduçõesemlínguainglesadaRevistaBrasileiradeReumatologia(RBR);ii)corpuscomparávelmonolínguecomostextostraduzidosemlínguainglesadaRBR,queserãocomparadosaostextosescritosoriginalmenteeminglêsdarevistaRheumatology; e iii) corpus comparável bilíngue, composto de textos escritosoriginalmente em inglês da Rheumatology e textos escritos originalmente emportuguês da RBR. A combinação desses corpora possibilitará verificar sedeterminadas abreviaturas/acrônimos sãomantidas inalteradas ou traduzidas e ospadrõesdeusodosmesmos,indicandosedeterminadopadrãoestárestritoaotextotraduzido ou se é mais frequente nele. Espera-se que tal conhecimento possaauxiliar tradutores e pesquisadores na produção de textos que tenham maisaceitaçãona comunidade internacional. ParaOlohan (2004), a influênciada línguade partida em padrões de uso observados na língua de chegada seria um dosprincipaisbenefíciosdacombinaçãoentreessesdoistiposdecorpora.Porém,visto

101

queastraduçõesobjetodestapesquisasãoemlínguainglesa,edadasuainfluênciana área aqui pesquisada, espera-seo cenário inverso, ou seja,maior influênciadalíngua inglesa sobre as abreviaturas e acrônimos usados em língua portuguesa,emborajásetenhaobservadoumnúmeroconsideráveldeabreviaturaseacrônimosemportuguês,comoéocasodeAINEs(anti-inflamatóriosnãoesteroides)eAVAQ(anodevidaajustadopelaqualidade)paraNSAIDs(non-steroidalanti-inflammatorydrugs)eQALYs(quality-adjustedlifeyears),respectivamente.

89

SOBRE A COMPILAÇÃO DE UM CORPUS PORTUGUÊS-INGLÊS DERESENHASDERESTAURANTESPARAFINSTRADUTÓRIOS

RozaneRebechi,AnaCristinaNevesNachtigall,HannahDosSantosKahneNatháliaGlasenapp

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected]

TemarecorrenteemprogramasdeTV,blogs,livroserevistas,otextoculinárionãodesfrutadesemelhantestatusempesquisasacadêmicas,possivelmentepelofatodeessegênerotextualtersidopormuitotempoconsideradoinferior,secomparadoàliteratura e a outras artes (Cf. Capatti e Montanari 1999). Contudo, com aglobalização textos culinários são constantemente traduzidos de uma língua paraoutra, evidenciando falta de padronização na escolha dos equivalentes dereferências culturais, ausência de naturalidade, definições inconsistentes,descaracterização de marcas culturais e até mesmo erros grosseiros, que,obviamente,prejudicamacompreensãoporpartedoleitor(Rebechi2015).Apoucaoferta de materiais de referência para tradutores e redatores da área agrava osproblemas.Comopartedoprojeto“CulináriaparaFinsAcadêmicos:compilaçãodeum corpus de textos culinários com foco na tradução”, desenvolvido junto aoInstituto de Letras daUFRGS, esta pesquisa em andamento, que visa a abordar acompilação e a análise preliminar de um corpus comparável bilíngue português-inglês de resenhas de restaurantes para a extração de termos em português, eequivalentes, fraseologias e exemplos de uso em inglês, apoia-se nametodologiasubjacente à Linguística de Corpus (Sinclair 1991; Bowker e Pearson 2002), naabordagem funcionalista da tradução (Nord 1991) e na Teoria Comunicativa daTerminologia (Cabré2005).Paraatingirosobjetivospropostos, foramselecionadasresenhas publicadas em periódicos brasileiros e norte-americanos de grandecirculação.Cadasubcorpuscontabilizaaproximadamente300.000palavras(tokens)e foi processado por meio da ferramenta WordSmith 6.0 (Scott, 2012). Olevantamento das palavras-chave em português mostrou que dois termos sãoutilizados para se referir ao estabelecimento: ‘casa’ e ‘restaurante’. Já em inglês,utiliza-se apenas restaurant para o mesmo fim. Nas resenhas em português, érecorrente a expressão ‘acesso para deficientes’. Já no subcorpus em inglês, foiidentificadarecorrênciadewheelchairaccess,equivalentequesemostraapropriadopara garantir a convencionalidade da tradução ou redação em língua inglesa. Olevantamento de combinações de palavras (clusters) também permite que se

102

identifiquem fraseologias equivalentes nos dois idiomas. Save/leave room fordessertpodeserconsideradaequivalentepara‘Reserveespaçoparaasobremesa’.Oprodutofinalseráumglossáriodelivreacessoqueauxilietradutoreseredatoresdaáreaaredigirtextosquefluamcomnaturalidadenalínguadechegada,pormeiode uma abordagem empírica baseada em textos autênticos, considerando-sediferençaslinguísticaseculturaisnassociedadesenvolvidas.

93

PROPOSTA DE UM VOCABULÁRIO BILÍNGUE DE FESTAS POPULARESBRASILEIRASBASEADOEMUMESTUDODECORPUS

GiovanaMartinsdeCastroMarqueze

ProgramadePós-GraduaçãoemEstudosdaTradução-UniversidadedeSãoPaulo(USP)

[email protected]

INTRODUÇÃO:Esteresumotratadeumapesquisaemandamentoquevisaproporuma obra terminográfica bilíngue na direção português/ inglês sobre festaspopulares brasileiras que tenha como público-alvo profissionais que produzemtextosturísticoseminglêssobreoBrasil,sejamelestraduçõesouproduçõesnesseidioma.Apropostadaobraéorientadapelaanálisedeumcorpusparaleloedeumcorpus comparável bilíngues contendo textos turísticos. O intuito desse estudo éobservarosdesafiosencontradospelostradutoreseredatoresdessegênerotextualao depararem com os referentes culturais relativos a festas populares brasileiraspara que, assim, possamos pensar uma obra que vá ao encontro de suasnecessidades.METODOLOGIA:Paraestapesquisa,quetemaLinguísticadeCorpuscomo aporte metodológico, foram compilados um corpus paralelo e um corpuscomparável bilíngues. O primeiro é composto por textos turísticos sobre o Brasilescritos originalmente em português com tradução para o inglês e o segundo écompostoportextosturísticossobreoBrasilescritosoriginalmenteemportuguêsepor textos escritos originalmente em inglês. Os textos em português do corpuscomparável foram submetidos à análise semiautomática com a ferramentaKeywordsdoprogramaAntConc3.4.4paraextraçãodostermosrelativosaeventospopulares brasileiros, os quais serão analisados e formarão as entradas da obraterminográfica proposta. Trinta e cinco termos foram selecionados e divididos emcinco categorias: Festas populares: Carnaval, Bumba-meu-boi/Boi-bumbá, FestivalFolclórico de Parintins, Festa Junina /Festa de São João, Festa do Divino, Círio deNazaré,ProcissãodoFogaréu,Cavalhadas.MúsicaseDanças:samba,samba-enredo,forró, xote, xaxado, frevo,marchinha, axé, tambor-de-crioula,quadrilha. Símbolos:(Boi) Caprichoso, (Boi) Garantido, boneco gigante de Olinda, arraial. Organização:escoladesamba,trioelétrico,blocoderua/decarnaval,bumbódromo,sambódromo,abadá.Comidas típicas: tapioca,pamonha, canjica,quentão,pédemoleque.EssestermosestãotendosuastraduçõescotejadasnoAntPconc1.1.0,concordanciadordecorporaparalelos.Concomitantemente,estásendoexploradoocorpuscomparávelafim de auxiliar na elaboração de definições dos termos na obra terminográficaproposta.RESULTADOSPARCIAIS:Osresultadosobtidosatéomomentoapartirdaanálise do corpus paralelo mostram que o mesmo texto turístico escrito

103

originalmenteemportuguêstrazdiferentestraduçõesedefiniçõesparaummesmoreferente cultural, oquemuitas vezesdeixouo textoem inglês confuso,podendoprejudicarumdosobjetivosdessegênero textualqueéodeatrair turistasparaolocal e/ouatividadepromovidos.Aanálisedo subcorpus comparável em inglêsdotermo“FestadeSãoJoão”mostrouquenãoestáclaroparaosautoresdedoisdostrêsguiasestrangeirosqueafestafazpartedasnossaschamadas“FestasJuninas”.Enquanto um autor afirma ser o “São João” uma festa de Candomblé, o outroinforma que a festa trata de um concurso de dança no Nordeste. Esse resultadoreforça a importância de uma obra terminográfica na área que contenhainformaçõesenciclopédicas.Omodelodeverbeteestáemfasedeelaboração.

96

EXTRAÇÃOEANÁLISEDEPADRÕESLÉXICO-GRAMATICAISEMARTIGOSACADÊMICO-CIENTÍFICOSEMDIFERENTESÁREAS

CristianeKilianeSandraLoguercio

UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected],[email protected]

Para a redação de artigos acadêmico-científicos é necessário, além de empregaradequadamenteo léxicoeas fraseologiasde conhecimentoespecializadodaárea,também fazer uso das convenções retóricas utilizadas nesse gênero discursivo.Comocontribuiçãoparaoestudodessesmodosdedizer,oobjetivodestetrabalhoéapresentar a extração e a análise de padrões léxico-gramaticais da linguagemcientíficaempregadaemartigosacadêmico-científicosrelacionadosaogêneroenãopropriamente à área de especialidade. Como corpus de estudo, utilizamos artigosemlínguaportuguesadetrêsáreasdistintas:Linguística,EngenhariadeMateriaiseCiências Econômicas, coletados de periódicos indexados no SciELO. Procedemos àextração e análise segundo os aportes teórico-metodológicos da Linguística deCorpus.Utilizamos as ferramentas de análise linguística doAntConc - versão3.4.4(Anthony,2014)paraageraçãodelistasdepalavras,geraçãoden-gramaseclusters,bem como geração de concordâncias. Combase emTutin (2007), classificamos asestruturas encontradas emmetacientíficas, aquelas relativas ao fazer científico (Aanálise dos dados mostrou que ...; Este trabalho tem como objetivo ...) emetadiscursivas, aquelas relativas à interação autor e destinatários, às relaçõesinternas do texto, ao posicionamento do autor, etc. (Nas seções a seguir, ...; Valeressaltar o papel fundamental de ...). Quanto à macroestrutura, a análise apontaparadiferençasnaorganização textual dos artigosdas três áreasdeespecialidadeanalisadas,sendoosartigosdaáreadeEngenhariadeMateriaisosqueapresentamuma estrutura mais fixa e com menos variação. Quanto aos padrões léxico-gramaticais, verificamos que as estruturas encontradas podem estar vinculadas auma parte específica do texto ou ocorrer emmais de um segmento textual, nãoestando relacionadas à sua macroestrutura, mas à argumentação e à construçãodiscursivadecadaparte,queexigemuitasvezesosmesmosmovimentosretóricos(cf.Swales,1990).Osresultadosdestetrabalhodarãosubsídiosparaaconstruçãodeobjetos de aprendizagem (OA) on-line e de livre acesso que contribuirão para o

104

desenvolvimentodecompetênciasehabilidadesrelativasà leitura,compreensãoeproduçãodetextosnomeioacadêmico.

98

TRADUÇÃOAUTOMÁTICA:VILÃOUNEMTANTO?

MicheldeSousaTeixeiraeCláudiaFreitas

PontifíciaUniversidadeCatólicadoRiodeJaneiro(PUC-RIO)

[email protected],[email protected]

A traduçãoautomática (TA) é, hoje, uma ferramentaamplamenteutilizadanão sóporempresasdeserviçosde traduçãoe tradutoresprofissionais,mas tambémporpessoas comuns, para diversos objetivos. Este trabalho analisa, em termosquantitativos e qualitativos, o desempenho de ferramentas de TA e de traduçãoassistida por computador (CAT) disponíveis comercialmente. Busca, também,apontarasperspectivasdeusodaTAnofuturo.

101

OUSODALINGUÍSTICADECORPUSECORPORADEAPRENDIZESPARAAPRODUÇÃODEATIVIDADESDIDÁTICASEPARAOENSINODEINGLÊSCOMFINSACADÊMICOS

AnnaLuisaLopesAlves

Departamento de Letras Modernas – Universidade Estadual Paulista Júlio de Mesquita Filho(UNESP)

[email protected]

Nomundoglobalizadoemquevivemos,notamosqueautilizaçãodalínguainglesa(doravante LI), tida como língua franca (JENKINS, 2007), é prática recorrente emmeio acadêmico, devido ao progresso da internacionalização de universidades doBrasil,assimcomoademandadepublicaçõesemrevistascientíficasporalunosdeinstituições acadêmicas brasileiras. Utilizaremos, portanto, a área de estudos dalinguística de corpus para embasar a presente pesquisa quanto à utilização deferramentas linguísticas e tecnológicas e o uso de corpus para o ensino de LI(BERBER SARDINHA, 2010; VIANA, 2010) e também para o desenvolvimento deatividadesdidáticasparaumcursodeInglêscomFinsAcadêmicos.

De acordo comaprodutividadedousode corporaparao ensino e para traduçãopedagógica,podemosdizerqueaLinguísticadeCorpus(LC)cooperaparaoensinoquesedesenvolveapartirdadescriçãodalinguagem,eessadescriçãoqueseapoianoscorporadeaprendizesteveumimpactoconsiderávelsobreoensinodelínguasestrangeiras,portanto,as informaçõesanteriores justificamnossaescolhapelousoda LC e de corpus de textos escritos para o desenvolvimento de atividadespedagógicas (ainda em fase de desenvolvimento) que visam o ensino eaprendizagemmaisautônomosdosalunos.

105

Osobjetivosdessapesquisasão:mostrarcomoaLC,utilizadaemumcursodeInglêscomFinsAcadêmicos(SWALESeFEAK,2009;DAYRELL,2011;CHARLES,2012;PINTO,noprelo),éefetivaquandose tratadodesenvolvimentodaescritade resumosdeartigos(abstracts);analisarestruturasepalavrasrelevantesnocorpusdeaprendizesquecaracterizamaescritaacadêmicaeminglêse,desenvolveratividadesdidáticaspedagógicas,apartirdaanálisedos textos,para futuroscursosde língua inglesaeInglês com Fins Acadêmicos baseados em corpora. Essa pesquisa está em fase dedesenvolvimento e, para alcançarmos nossos objetivos utilizaremos resumos deartigosescritosemlínguainglesa,poralunosnão-nativosdegraduaçãoemestradodaUnespdeSãoJosédoRioPreto,paraacompilaçãodocorpusdeaprendizes.

Após recolher os dados dos alunos, usaremos a ferramenta computacional depesquisa linguística, o AntConc®, para desenvolvermos uma análise que buscaestabelecer a comparação da escrita de resumos de artigo em inglês por alunosnativos(cujostextosfazempartedocorpusdoMICUSP-MichiganCorpusofUpper-LevelSudentsPapers)eenão-nativos (alunosdaUnesp).Acomparação levaráemconta as palavras que exprimem “urgência” e “importância” (palavras, estas, quecativama atençãodo leitor para que se interesse pelo trabalho apresentadopeloaluno),comoestassãousadas,ocontexto,oco-textoeasestruturasgramaticaisemqueaspalavraspesquisadasestãoinseridasnostextosacadêmicosdosaprendizes.Ademais, compararemos como algumas palavras essenciais para um textoacadêmico (como textmarkers epalavras gramaticais, porexemplo) sãoutilizadasnapráticadeescritaacadêmicadosalunosnativosenão-nativos.

Comoresultados,criaremoslistasdeconcordânciasdaspalavrasaseremanalisadase comessas listas desenvolveremos atividadesdidáticas para serem colocadas emprática em cursos de Inglês com Fins Acadêmicos para as três grandes áreas doconhecimento,eassim,contribuirparaodesenvolvimentodaaprendizagemdeLInacomunidadeacadêmicabrasileira.

102

TEXTUAL DISCOURSE ANALYSIS: TOWARDS A PRAGMATIC-ARGUMENTATIVEMODELFORTHEINTERNATIONALLEGALDISCOURSE

HálisAlvesdoNascimentoFrança

Programa de Pós-graduação em Estudos da Linguagem (PPgEL) – Universidade Federal do RioGrandedoNorte(UFRN)

[email protected]

Introduction: This research proposal concerns the development of a theoreticalmodel of pragmatic-argumentative nature, having as starting point the TextualDiscourse Analysis and, as object, the international legal discourse in Englishlanguage,i.e.,multilateralenvironmentalagreements(MEAs).Forthatpurpose,itisfundamentally grounded on branches of theoretical and descriptive linguistics,focusingfurtheronpragmaticsandargumentationtheory.Thepurposeofthemodellies in the corpus-based identification of the acting forces underlying selected

106

sentences from MEAs, considering the measure or degree to which that givensentencemeanstoenforceagivenlegalcommitment.Forexample,whenacertainsentencestatesthat(a)Partiesshallprovide,whereasanotherstatesthat(b)Statesshall take all practicable steps to promote, what kind of forces act on thosestatements, in such a way as to define their measurement or degree ofenforcement? Is (a) stronger than (b), in the sense that the Parties becomemorecommitted? If so, how does it happen and how frequently so? In principle, thisresearch suggests that these forces are structured around an interaction thatconsiders the degree of strength of illocutionary forces (grounded on speech acttheory and illocutionary logic analytic tools) and the force of their arguments(groundedonargumentationtheory,legalargumentationandinformallogic).

Methodology:ThemodelfollowstheTextualDiscourseAnalysisonitsfinal levelofexamination (speech acts and argumentative orientation) and consists of severalprocedures comprised in five stages: (1) determination of global features of thecorpus and text plan; (2) selection of sentences compatible to the scope of themodel, i. e., those that reflect any measure or degree of enforcement; (3) bi-operational analysis of illocutionary and argumentative forces acting on thosesentences; (4) analysis of the correlation between the resulting illocutionary-argumentativeforcesandsubsequentmappingoftheiroccurrencesandinteractionsthroughoutthecorpus.Totheextentoftheobtaineddatatherewith,themodelwillproceedtothe(5)developmentofanintensityscaleabletopinpointthemeasureordegreeofenforcementofthoseforces.Accordingtotheirdistributioninanintensitycontinuum, ranging from 1 (evidently/absolutely binding) to < 1 (increasingly lessbinding), themodelwill position corpus data in such away that itmay provide adifferent display for each MEA, indicating, thus, how strong are the obligationscontained in their texts, alongwith detailed information on each commitment bymeansoftheirpragmatic/argumentmaps.

Partial Results: Preliminary results are still forthcoming. However, it is generallyexpectedthatthismodelwillcontributetothedescriptionoflinguisticphenomenarelated to the international legal discourse and aid in a number of problemsconcerninglegalhermeneuticsandformalizationoflegalarguments.Moreover,theauthor intends to fostercommunicationwith researchersoncorpus linguisticsandcomputational linguistics in order to improve the analytic model currently beingdevelopedtowardsamoreefficienttooloflinguisticquali-quantitativedescriptionofnaturallanguagesinthecontextofinternationalagreements.

107

104

LEGENDAGEM,CORPORAEANÁLISEDODISCURSO

ElaineTrindade

UniversidadedeSãoPaulo(USP)

[email protected]

Oobjetivodeste trabalhoédesenvolveraAnálisedoDiscursodeduas versõesdelegendas em português da série Suits, primeira temporada, visando identificarvariaçõesdodiscursoconsiderandoamensagemfinaldostextosemportuguês,emcomparação com o texto original em inglês. Com relação às duas versões, serãoutilizadas, a legenda oficial exibida pelo streaming de vídeo Netflix e as legendasfeitas por fansubsque sãodisponibilizadas gratuitamente em sites na internet. Aslegendas de fansubs são consideradas por Diaz-Cintas e Munhoz (2006) comolegendas feitas por amadores. Como Netflix contrata tradutores profissionais, aanálise também apresenta uma comparação entre legendas profissionais eamadoras. A legendagem é uma área dos Estudos da Tradução que desperta umgrande interesse na população em geral. Entretanto, quando buscamos estudosacadêmicosnestaárea,épossívelidentificarqueessesestudosaindaestãoemsuasfases iniciais, visto que eles foram iniciados há pouco mais de 20 anos. Há,principalmente em língua portuguesa, uma carência em estudos que abordem aqualidadedatraduçãoquandoconsideramosamensagemtransmitidanaslegendasse comparadas ao áudio original. Sendo assim, um estudo que visa desenvolver aanálisedodiscursodeduasversõesdelegendasfrenteaooriginal,podeapresentardadosimportantesparaavançosnaqualidadedatraduçãoparalegenda.Umpontoquevaledestaque,équeoprocessoutilizadoporprofissionaiseamadoressãobemdistintos. O profissional é obrigado a seguir regras e normas definidas pelosexibidoresnacomposiçãodotextoemlínguaportuguesa,enquantooamadortemliberdade no processo tradutório. Ambos seguem as regras técnicas, mas nomomentodatradução,asescolhasdepalavrassãomaislivresparaoamador.Paradesenvolverapesquisa,aLinguísticadeCorpus,utilizandoosoftwareAntConc,terápapelfundamentalnolevantamentodecolocadosekeywords.Apósaidentificaçãodedadosconflitantesentreasduasversões,análisesmaisdetalhadascomrelaçãoao discurso são realizadas e as orientações para esse estudo seguem critériosapresentadosporFairclough(1995),VanDijk(1980)eBaker(2006).

108

106

ELABORAÇÃO DE TAREFAS PEDAGÓGICAS COM BASE EM CORPUS:EXPLORANDORECURSOSLINGUÍSTICOS

AnamariaWelpeÁlvaroR.Didio

DepartamentodeLínguasModernas–InstitutodeLetras-UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected],[email protected]

EstetrabalhovisarelataroandamentodoprojetodepesquisaintituladoConstruçãodeumbancodetarefaspedagógicasparaasdisciplinasdeinglêsdocursodeLetras:compilação de corpus e aplicações didáticas. O projeto tem por objetivos [1]compilartextosquecirculamdentrodastemáticasegênerosdodiscursoabordadosnas disciplinas de Inglês I a V do curso de Letras da Universidade Federal do RioGrande do Sul (UFRGS) – cujo currículo é organizado por eixos temáticos – paraentão [2] elaborar tarefas pedagógicas que exploremos recursos linguísticosmaispresentesemtaistextos.

Naprimeiraetapadoprojeto foi compiladoumcorpuspara cada temática.A faseapresentadaaqui tevea finalidadede [1]atualizarocorpusatravésdecompilaçãode novos textos para cada disciplina; [2] analisar o corpus através do softwareAntConcnabuscadepadrõesdeusodalinguagem,ouseja,palavras-chave,palavrasmais frequentes, agrupamento de palavras e colocações presentes nos gêneros etemáticasdecadadisciplina;e[3],comoresultado,elaborartarefaspedagógicasquevisem a familiarização dos alunos com os recursos linguísticos necessários para acompreensãoeproduçãodetextosexigidasnasdisciplinas.

A títulode ilustração, seráapresentadauma tarefaelaboradaparaumasequênciadidática da disciplina de Inglês IV, cujo eixo temático é Contemporary Issues inCinemaandLiteratureeoproduto finaléuma resenhacinematográfica.Ocorpuspara a elaboração desta tarefa, portanto, foi composto de 3.005 resenhascinematográficas obtidas a partir do website IMDb (Internet Movie Database),resultando em 25.248 word types e 1.067.248 word tokens; também, quanto àextração dos padrões léxico-gramaticais mais estáveis e frequentes, foramselecionadosaquelesde4e5palavrasecomfrequênciamínimade12ocorrências.Estesdados foramabaseparaacriaçãoda tarefaemquestãoepermitemqueosalunosproduzamseustextosapartirdousorealdalínguaevidenciadopelaanálisedocorpus.

109

108

COMENTCORPUS: O USO DE MECANISMOS LINGUÍSTICOS NADETECÇÃODE IRONIA E SARCASMO PARAO PORTUGUÊS DO BRASILEMUMCORPUSOPINATIVO

GabrielaWickPedroeOtoAraújoVale

UniversidadeFederaldeSãoCarlos(UFSCar)

[email protected],[email protected]

Aironiaeosarcasmosãomecanismosquesãocapazesdealterarosentidodeumasentença ou transformar sua polaridade positiva para negativa e vice-versa. Oestudodasexpressões irônicaspodeserumbomrecursonosentidodeaprimorarferramentas de Análise de Sentimentos, ou Mineração de Opinião, domínio doProcessamento de Linguagem Natural que tem como objetivo analisarcomputacionalmenteopiniões,emoções,sentimentosesubjetividadespresentesemtextos (Liu, 2012). Pesquisas para o inglês (Gonzáles-Ibáñez et al, 2011), para oportuguês europeu (Carvalho et al, 2009) identificaram padrões e mecanismoslinguísticos que podem detectar sentenças irônicas em corpora Freitas (2013)apresentou alguns desafios que a ironia apresenta para a identificaçãode opiniãoemtextosdoportuguêsdoBrasil.Nopresenteprojetobusca-seanalisaredescrevermecanismos subjacentesàexpressãode ironiaem textosavaliativosnoportuguêsdo Brasil, tendo como propósito a criação de formalizações capazes de detectarpossíveisconstruçõesirônicasesarcásticas.Paraexaminarasocorrênciasdeironiaesarcasmo partiremos da busca em um corpus previamente construído porcomentários de notícias e anotado de acordo com as expressões irônicas esarcásticas identificadas.OComentCorpuséumcorpusdecomentáriosdenotíciasanotadomanualmentecominformaçõesdesentimento.Acoleçãoécompostapor6.185 comentários do domínio político retirados de 90 notícias relacionadas aoperíodo pré-impeachment do caderno Poder do jornal Folha de São Paulo,totalizando14milsentençase207milpalavras.AanotaçãodocorpusébaseadanadefiniçãodeopiniãopropostaporLiu(2012),ondetodaopiniãoécompostaporpelomenosdoiselementos fundamentais:alvo (podendoserumaentidade,aspectodeuma entidade, um produto, pessoa, organização, marca, evento, etc.) e umsentimento (que representa uma atitude, opinião ou emoção em que o autor daopiniãotemarespeitodeumdeterminadoalvo).Atéopresentemomentoocorpusfoi anotado de acordo com o autor da opinião, data, alvo da opinião e presençaeventual de ironia. Cada comentário contém um autor de opinião sobre umdeterminadoalvoeadatanaqualaopiniãofoiexpressapeloautor.Umasentençaopinativapodeconterexpressõesirônicassubdivididaspreviamenteemdiminutivo,aspas e pontuação. Após a primeira etapa coma identificação de expressões, nasetapas seguintes inserem-se a anotação sentenças irônicas de acordo commecanismos utilizados para expressar ironia e a classificação em diferentescategorias,representadosempadrõesléxico-sintáticos.Assim,espera-seestabelecerumalistacomclassificaçõesecaracterísticasdeironiaesarcasmo,colaborandocom

110

o desenvolvimento da área e aperfeiçoando ferramentas de identificaçãoautomáticadeopinião.

109

LEXICAL BUNDLES ACROSS THE METHODOLOGY AND RESULTSSECTIONSOFAPPLIEDLINGUISTCISRESEARCHARTICLES

LucianadeMacedoUniversidadeFederaldeMinasGerais(UFMG)

[email protected]

Bearinginmindtherelevanceofappropriateuseoflexicalbundlesintheacademicdiscourse,thisresearchprovidesacloseranalysisofhowresearchersemploytheseelements, in connectionwith the rhetoricalmoves scheme, in specific sections oftheir research articles (RA) in Applied Linguistics. Lexical bundles and rhetoricalmoves are both considered building blocks to be used in the construction ofdiscourse (CORTES, 2013). Lexical bundles have been defined as recurrentexpressionsthatcanberetrievedfromourmemoryas“textbuildingblocks”(BIBER,CONRAD, & LEECH, 2002, p.443) and “ important building blocks of coherentdiscourse and characteristic features of language use in particular settings”(HYLAND, 2008, p.8). Similarly, rhetorical moves are explained as “main buildingblocks”ofagenre(BIBER,CONNOR,andUPTON,2007,p.53).Dudley-Evans(1995)also highlights that rhetorical moves are so inherently part of a genre that theyshould be used to teach novice writers how to produce successful texts in aparticular genre. For that reason, we have begun to compile a list of the mostfrequentlyusedlexicalbundles,connectedtotherhetoricalmovesschemefromtwosections of Applied Linguistics RAs: 1.Methodology and 2.Results/Discussion. TheRAs analyzed were written by native English speakers and/or highly proficientEnglish speakers. In order to retrieve reliable and valid data, each subcorpuspresentsasignificantnumberofwords,roughly300,000.TheywereallcollectedviaPeriódicosCAPES, fromsixmajorareasofAppliedLinguistics,soasto increasethecorpusrepresentativeness.Thepopulationofthecorporawasselectedbasedonthedefinitionofareasincorporatedinthe2016AILACongress(InternationalAssociationof Applied Linguistics). After this process of compilation, the lexical bundles weregenerated and analyzed in consonance with a move scheme designed by Swales(1990, 2004), and its adaptations (YANG & ALLISON, 2003; CORTES, 2004;KANOKSILAPATHAM, 2005 and CORTES, 2013). Primary results show that theDiscussion/Results section yields a high number of lexical bundles whichcommunicate stance, suchasappear(s) tobe;at least in; is likely to (be); to someextent;alongmanyothers.ThiscorroborateswhatHyland(1998)claimedabouttheprocessofpersuasion.Hestatesthatpersuadingdependsonhowwellexperimentsand results are presented and contextualized, this should be done with caution,precision and humility. The lexical bundles identified in the Discussion/Resultssection imply a close relationshipwith themoves proposed by Kanoksilapatham's(2005), such as in Results: Providing justifications for the choice of procedures,Stating results, and Commenting results; and in Discussion: Consolidating results,

111

Statinglimitations,andSuggestingfurtherstudies.Thenextstepsaretounderstandwhat other lexical bundles are typical of each section separately; investigatewhether there is a relationship between the bundle structure and its function.Finally,ourultimateaimistocreateacomprehensivelistofthebundleswithineachcategoryofmovesorstepsfromeachsectionanalyzed.

112

A CONSTRUÇÃO DE UM OBJETO DIGITAL DE APRENDIZAGEM (ODA)PARA A REDAÇÃO DE RESUMOS ESTRUTURADOS: UM ESTUDOBASEADOEMCORPUS

AnaElizaPereiraBocorny,BibianaSiebelFinkler,FernandaCorreaSoldatelli,LauraPires,RosanaBeatrizErnzeneVivianMeurerLameira

DepartamentodeLínguasModernas–InstitutodeLetras–UniversidadeFederaldoRioGrandedoSul(UFRGS)

[email protected],[email protected],[email protected],[email protected],[email protected],[email protected]

O movimento de internacionalização das IES brasileiras motivou diferentes açõespara a promoção do letramento acadêmico de alunos, professores e técnicosadministrativos.UmadestasaçõesfoioProgramaIdiomassemFronteiras.Outrafoio desenvolvimento de um Ambiente Virtual de Aprendizagem (AVA) denominado“LÚMINA Idiomas” no âmbito da Universidade Federal do Rio Grande do Sul(UFRGS).DentreosdiversosrecursosoferecidospeloAVAestãoosObjetosDigitaisdeAprendizagem(ODA),entendidosaquicomo“recursoscapazesdeproporcionar,medianteacombinaçãodediferentesmídiasdigitais,situaçõesdeaprendizagememqueoeducadorassumaocaráterdemediadoreoalunoocaráterdesujeitoativodentrodoprocessodeensinoaprendizagem”(Audino&Nascimento,2010).Apartirdo contexto apresentado, este trabalho tem como objetivo identificar os padrõesléxico-gramaticais (e.g. theaimofthisstudyis) mais frequentes em diferentesmovimentosretóricosderesumosestruturadosescritoseminglêsdecincoáreasdoconhecimento como forma de auxiliar o processo de construção coletiva ecompartilhada do ODA denominado “Como escrever um AbstractEstruturado”. Osreferidos padrões léxico-gramaticais usados para a construção do ODA foramextraídos de um corpus constituído de cinco sub-corporade diferentes áreas doconhecimento: (i) ciênciadacomputação (CI), (ii)psicologia (PI), (iii) farmácia (FA),(iv)medicina (ME)e (v) engenharia (EN).Os resumosestruturados (100para cadaárea) foram retirados de artigos recentes (2013 - 2017), publicados em inglês emperiódicosdealtofatordeimpacto,totalizando500resumos(125.962tokens).Paraa realização de tal levantamento foram observadas as seguintes etapasmetodológicas: (i) identificação dos principais movimentos retóricos do gêneroresumo, conformemodelo estabelecidopor Swales (1981, 1990, 2004), (ii) análisedos movimentos presentes em cada resumo de cada periódico e registro destesdadosemumatabelacomparativa,(iii)extraçãodospadrõesléxico-gramaticaismaisestáveisefrequentescom4,5e6palavrasecomumafrequênciamínimade3,para

112

cada movimento retórico dos resumos estruturados. A tabela que segue mostraalgunsresultadosparaaparteBACKGROUNDdosresumos.

Osresultadosdesteslevantamentospermitiramaconstruçãodeumatabelacomosdiferentesmovimentos retóricos de resumos estruturados de cada uma das cincoáreasestudadaseseusrespectivospadrõesléxico-gramaticaismaisfrequentes.