WORD SKETCH COMO FERRAMENTA PARA EXTRAÇÃO DE COLOCAÇÕES
DOI:
https://doi.org/10.21165/gel.v17i2.2771Abstract
Neste trabalho, descrevemos métodos de identificação e extração de colocações em corpora textuais de língua geral, produzidas por aprendizes de língua inglesa em textos acadêmicos, e de colocações especializadas da área da Conservação e Restauração de Patrimônio Cultural por meio da ferramenta Word Sketch (WS), do software Sketch Engine. Ao entendermos colocações como palavras que frequentemente ocorrem juntas em função do seu grau de atração semântica, o objetivo deste trabalho é demonstrar como a ferramenta WS permite a identificação e extração de colocações de uma forma semiautomática, uma vez que, após a extração, é papel do pesquisador levar em conta os demais critérios constituintes de uma colocação. Sejam de língua geral ou de língua de especialidade, as colocações são unidades constituídas por critérios sintático-semânticos, pragmáticos e discursivos. Como aporte teórico-metodológico, apoiamo-nos na Linguística de Corpus e buscamos estabelecer critérios para a extração de colocações através da ferramenta WS. Nossos resultados indicam que a ferramenta WS é eficaz para a tarefa de extração de colocações tanto de escrita acadêmica como de linguagem especializada, pois permite que a identificação das unidades parta de seus critérios de constituição.
Downloads
Downloads
Pubblicato
Come citare
Fascicolo
Sezione
Licenza
Esta revista oferece acesso livre imediato ao seu conteúdo, seguindo o princípio de que disponibilizar gratuitamente o conhecimento científico ao público proporciona maior democratização mundial do conhecimento.
A REVISTA DO GEL não cobra taxa de submissão ou de editoração de artigos (articles processing charges – APC).
Os critérios gerais de direitos autorais da REVISTA DO GEL estão dispostos no termo de direitos autorais que cada autor aceita ao submeter seu trabalho no periódico. Como regra geral o periódico utiliza as regras CC BY-NC da Creative Commons (regra disponível em: https://creativecommons.org/licenses/by-nc/4.0/legalcode)