48
Avaliação e Simplificação Ferramentas e pesquisas com corpora para o ensino e reescrita de textos Aline Evers Bianca Franco Pasqualini 1

Avaliação e Simplificação Ferramentas e pesquisas com ... · Score = 206.835 – (1.015 x ASL) – (84.6 x ASW) ASL = Average sentence length (i.e., the number of words divided

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

  • Avaliação e Simplificação

    Ferramentas e pesquisas com corpora para o ensino e

    reescrita de textos

    Aline EversBianca Franco Pasqualini

    1

  • Readability Assessment

    2

    readability ou legibilidade ou complexidade:

    desde os anos 1920 (Davison e

    Green, 1988)

    2

  • A Linguística de Corpus

    3

    ❏ Empirismo e observação direta de dados

    ❏ Uso de computadores❏ Linguagem como sistema

    probabilístico

    Uma abordagem ou uma metodologia?

    Corpus-driven: a verdade está no corpus

    Corpus-based: confirmação de teorias preconcebidas

    3

  • 4

    A Linguística de Corpus

    4

    Falado x

    Escrito

    Geralx

    Espec.

    Simplesx

    Etiquet.

    Monox

    Bi

    Paralel.x

    Compa.

    Lexicografia

    Terminologia

    L. Computacional

    Est. Literários

    Tradutologia

    Ensino de Línguas

  • 55

    http://www.ufrgs.br/textecc/porlexbras/porpopular/

    http://www.ufrgs.br/textecc/porlexbras/porpopular/

  • 6

    Avaliar

    6

  • 7

    Simplificar

    7

  • 88

  • Avaliar: um exemplo e um exercício

    99

  • 1010

  • A Grade de Avaliação

    1111

  • Utopia dos ExcesosComicidade espontânea, estímulo à criticidade individual e coletiva. Elemento fundamental à

    perpetuação das mídias e manifestação dos anseios populares, a prática humorística é delineada como um verdadeiro invólucro de emoções contidas e pensamentos involuntariamente definidos. Contribuição significativa para a profusão de atmosferas inovadoras, o humor é o limiar entre uma realidade cabível à concepção humana e o ecoar de uma essência que é visivelmente perturbadora.

    A serviço de um propósito aquém das tradicionais manifestações cômicas, a jocosidade e as brincadeiras ridicularizando o próprio comportamento humano aparecem como destaque principal de um projeto articulado nos moldes da sociedade atual. Produções incertas e descontraídas são a concretização de um espírito libertador e compatível com as deficiências e ambiguidades típicas dos excessos humanos.

    Panorama não muito satisfatório, o humor entra em cena, muitas vezes, como o grande vilão da trama. Embora proferido em tom de deboche, sua ampla difusão é sinônimo de contestação e incompreensão. Atingindo a ótica de satirização coletiva, a prática é encarada como um verdadeiro desdém à vivacidade humana.

    Aceitar e rever conceitos individuais é, sem sombra de dúvida, um grande desafio para os que travam uma batalha constante com as posturas reflexivas íntimas. Defrontamo-nos com situações que nos desestabilizam e nos colocam a par de uma zona de conforto conhecida é um mecanismo que, infelizmente, ainda não adquirimos controle.

    Talvez a possibilidade de encarar os próprios defeitos seja a alavanca para, como diria Arquimedes, “mover o mundo”. Entretanto, para que possamos chegar a tal patamar, devemos abrir mão de uma mentalidade arcáica que nos impede de enxergar a vida como um constante e invariável processo de erros. Lidar com a hilaridade eminente é o primeiro passo para que tenhamos maturidade suficiente para encarar nossos medos e rir de nossas falhas, afinal somos frutos de erros e superações, elementos que nos fazem tão perfeitamente humanos.

    1212

  • Se você tivesse que atribuir uma nota a este texto…0 → 10

    1313

  • Gerador de lero-lerohttp://www.cafw.ufsm.br/~bruno/disciplinas/desenvolvimento_web/material/lerolero.html

    1414

    http://www.cafw.ufsm.br/~bruno/disciplinas/desenvolvimento_web/material/lerolero.html

  • Um exemplo de Enrolation 2.0

    Evidentemente, a expansão dos mercados mundiais estende o alcance e a importância de alternativas às soluções ortodoxas. Por outro lado, a necessidade de renovação processual agrega valor ao estabelecimento dos relacionamentos verticais entre as hierarquias. Não obstante, o comprometimento entre as equipes acarreta um processo de reformulação e modernização das regras de conduta normativas.

    No entanto, não podemos esquecer que a execução dos pontos do programa causa impacto indireto na reavaliação do sistema de formação de quadros que corresponde às necessidades. O incentivo ao avanço tecnológico, assim como o aumento do diálogo entre os diferentes setores produtivos cumpre um papel essencial na formulação de todos os recursos funcionais envolvidos. Caros amigos, o fenômeno da Internet assume importantes posições no estabelecimento do levantamento das variáveis envolvidas.

    Neste sentido, o consenso sobre a necessidade de qualificação é uma das consequências do orçamento setorial. Desta maneira, a competitividade nas transações comerciais pode nos levar a considerar a reestruturação da gestão inovadora da qual fazemos parte. Pensando mais a longo prazo, a mobilidade dos capitais internacionais talvez venha a ressaltar a relatividade do investimento em reciclagem técnica. Podemos já vislumbrar o modo pelo qual a crescente influência da mídia estimula a padronização do impacto na agilidade decisória.

    1515

  • 1616

  • 1717

  • 1818

  • 1919

  • 2020

  • 2121

    http://www.hemingwayapp.com/

    http://www.hemingwayapp.com/

  • 2222

  • 2323

  • 2424

  • Coh-Metrix-Porthttp://143.107.183.175:22680/

    2525

    http://143.107.183.175:22680/

  • % File generated by Coh-Metrix-Dementia on 2017-08-15 19:36:35.605574@RELATION corpus

    @ATTRIBUTE basic_counts:adjectives NUMERIC@ATTRIBUTE basic_counts:adverbs NUMERIC[...]@ATTRIBUTE coreference:adj_stem_ovl NUMERIC@ATTRIBUTE coreference:stem_ovl NUMERIC@ATTRIBUTE coreference:adj_cw_ovl NUMERIC@ATTRIBUTE anaphoras:adjacent_refs NUMERIC@ATTRIBUTE anaphoras:anaphoric_refs NUMERIC

    @DATA127.868852459016,36.0655737704918,590.16393442623,14.76973518285,409.83606557377,2.6,3.33888888888889,23.4615384615385,285.245901639344,5.0,13.0,305.0,65.5737704918033,140.983606557377,45.9016393442623,0.0,0.0,6.55737704918033,52.4590163934426,105714.711111111,202.384615384615,0.552631578947368,0.0,0.0,0.632786885245902,0.328018989557451,429.979382445446,7.46153846153846,108.196721311475,6.55737704918033,65.5737704918033,3.27868852459016,52.4590163934426,9.83606557377049,39.344262295082,0.0,0.0,3.71794871794872,2.72727272727273,3.52873563218391,8.63888888888889,0.416666666666667,0.282051282051282,0.75,0.858974358974359,0.5,0.0833333333333333,0.166666666666667

    2626

    Usar arquivos ARFF do Coh-Metrix-Port no WEKA (Aprendizado de Máquina)http://www.cs.waikato.ac.nz/ml/weka/

    http://www.cs.waikato.ac.nz/ml/weka/

  • 27

  • 28

  • 2929

  • 3030

  • brat rapid annotation toolhttp://brat.nlplab.org/

    3131

    http://brat.nlplab.org/

  • 3232

  • 3333

  • Simplificação

    34

  • Simplificação e Avaliação

    ● Letramento e Inteligibilidade → Fórmulas (Flesch)● Psicolinguística → Coesão, coerência● Linguística de Corpus → Como coletar, quais textos coletar, como extrair● Estudos de Tradução → Traduções aceitas pela Comunidade (T e E)● PLN → Simplificação para acessibilidade

    3535

  • Língua Portuguesa Brasileira Popular

    ● Falar a mesma língua não garante compreensão● Alto grau de dificuldade = alto grau de alienação● Cidadania restrita: a linguagem dos governos não é acessível

    3636

  • Língua Portuguesa Brasileira Popular

    ● Acesso restrito → produção cultural: quando não alcançamos a narrativa● Leitura: empatia, ideias, outras formas de ver o mundo● Restrição de acesso: informação e tecnologia (trabalhadores)

    3737

  • Fórmula

    Score = 206.835 – (1.015 x ASL) – (84.6 x ASW)

    ASL = Average sentence length (i.e., the number of words divided by the number of sentences) ASW = Average number of syllables per word (i.e., the number of syllables divided by the number of words)

    ❏ Rudolf Flesch – 50: Plain English❏ Readability formula❏ Adaptado para o PTBR – Nilc/USP, 1996

    3838

  • 3939

  • Linguagem Cidadãhttp://www.gespublica.gov.br/sites/default/files/documentos/linguagem_cidada_-_versao_final_web.pdf

    4040

    http://www.gespublica.gov.br/sites/default/files/documentos/linguagem_cidada_-_versao_final_web.pdf

  • 4141

  • Biblioteca de Links

    Coh-Metrixhttp://cohmetrix.com/

    Coh-Metrix-Porthttp://143.107.183.175:22680/

    Plain Englishhttp://www.plainlanguage.gov/

    Simple Englishhttp://www.simplish.org/

    Simplifica/Facilitawww.nilc.icmc.usp.br/simplifica/

    4242

    http://cohmetrix.com/http://143.107.183.175:22680/http://www.plainlanguage.gov/http://www.simplish.org/

  • Dicas: Simplificando...

    Conheça o público para o qual irá escrever: delimite o público, entenda suas limitações e considere o grau de instrução desse público.

    Evite palavras rebuscadas que só sirvam para “melhorar” o estilo do seu texto.

    Evite: Indubitavelmente, podemos observar…Solução: Sem dúvida, podemos observar…

    4343

  • Mantenha, sempre que possível, a ordem canônica da língua portuguesa (sujeito, verbo, objeto) em suas frases.

    Evite: Com pressa, o jornalista redigiu sua matéria.

    Solução: O jornalista redigiu sua matéria com pressa.

    4444

  • Divida seus parágrafos em sentenças mais curtas. Evite se prolongar em uma mesma frase quando for possível “quebrá-la” em duas ou mais frases.

    Evite: A lei, que prevê os princípios de Fraternidade e de Igualdade no artigo três da Constituição, define que todo o cidadão tenha direito a soluções igualitárias no mercado de trabalho e, por esse motivo, assegura…

    Solução: A lei prevê os princípios de Fraternidade e Igualdade no artigo três da Constituição. Ela define que todo o cidadão tem direito a soluções igualitárias no mercado de trabalho. Por isso, …

    4545

  • 4646

    Evite os pronomes oblíquos (me, te, nos, vos, etc.)

    Evite: Disse-lhes que esperassem pela confirmação…Solução: Disse a eles que esperassem pela confirmação…

    Mantenha os pronomes relativos próximos ao seus referentes.

    Evite: Todas as leis, limitadas pelo Estatuto Brasileiro e confirmadas pelo poder do Judiciário, que constam na Constituição…

    Solução: Todas as leis que constam na Constituição, limitadas pelo Estatuto Brasileiro e confirmadas pelo poder do Judiciário, ...

  • Reduza ou elimine a voz passiva.

    Evite: As leis foram criadas pelo novo presidente da empresa.

    Solução: O novo presidente da empresa criou as leis.

    4747

  • 4848

    [email protected]