Avaliação de ambientes de suporte à montagem automática de córpus a partir de textos da web e extração automática de termos.
Arquivos
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
A utilização de corpus está se generalizando progressivamente nas áreas da Linguística, do Processamento de Língua Natural (PLN), Tradução e Terminologia, para citar algumas. Embora já exista um número razoável de córpus genéricos (ou de referência,como são chamados) para várias línguas, o número de córpus específicos disponíveis para suporte à pesquisa terminológica, atividades de tradução e avaliação de recursos de PLN ainda é deficiente. Enquanto e' possível construir tais corpus por meio de busca manual na Web esse processo consome muito tempo se levarmos em conta os beneficios para pesquisas únicas. Para atender essa necessidade específica de criação e de pesquisa nesses tipos de corpus existem vários projetos que se propõem a disponibilizar ambientes para criação rápida de corpus e posterior pesquisa com eles. Um desses projetos é o Corpógrafo e outro o BootCaT. Os objetivos desta pesquisa foram o estudo e a avaliação dos dois ambientes acima mencionados para gerenciamento de córpus especializados, para serem utilizados, sejam suas próprias ferramentas ou a funcionalidade delas, no projeto Portal da Rede de Nanotecnologia da USP e no projeto Extração automática de termos e elaboração colaborativa de terminologias para o intercâmbio de conhecimento especializado, ambos sendo desenvolvidos no Núcleo lnterinstitucional de Linguística Computacional.