Avaliação de ambientes de suporte à montagem automática de córpus a partir de textos da web e extração automática de termos.
dc.contributor | Instituto de Ciências Matemáticas e de Computação – ICMC/USP | pt_BR |
dc.contributor.author | Genovês Jr., Luiz Carlos | |
dc.contributor.author | Aluisio, Sandra Maria | |
dc.date.accessioned | 2018-08-24T14:39:34Z | |
dc.date.available | 2018-08-24T14:39:34Z | |
dc.date.issued | 2005-10 | |
dc.description.abstract | A utilização de corpus está se generalizando progressivamente nas áreas da Linguística, do Processamento de Língua Natural (PLN), Tradução e Terminologia, para citar algumas. Embora já exista um número razoável de córpus genéricos (ou de referência,como são chamados) para várias línguas, o número de córpus específicos disponíveis para suporte à pesquisa terminológica, atividades de tradução e avaliação de recursos de PLN ainda é deficiente. Enquanto e' possível construir tais corpus por meio de busca manual na Web esse processo consome muito tempo se levarmos em conta os beneficios para pesquisas únicas. Para atender essa necessidade específica de criação e de pesquisa nesses tipos de corpus existem vários projetos que se propõem a disponibilizar ambientes para criação rápida de corpus e posterior pesquisa com eles. Um desses projetos é o Corpógrafo e outro o BootCaT. Os objetivos desta pesquisa foram o estudo e a avaliação dos dois ambientes acima mencionados para gerenciamento de córpus especializados, para serem utilizados, sejam suas próprias ferramentas ou a funcionalidade delas, no projeto Portal da Rede de Nanotecnologia da USP e no projeto Extração automática de termos e elaboração colaborativa de terminologias para o intercâmbio de conhecimento especializado, ambos sendo desenvolvidos no Núcleo lnterinstitucional de Linguística Computacional. | pt_BR |
dc.description.notes | Relatórios Técnicos do ICMC; 266 | pt_BR |
dc.format | 51 p. | pt_BR |
dc.identifier.uri | http://repositorio.icmc.usp.br//handle/RIICMC/6830 | |
dc.language.iso | por | pt_BR |
dc.publisher.city | São Carlos, SP, Brasil. | pt_BR |
dc.subject | Linguistica computacional | pt_BR |
dc.title | Avaliação de ambientes de suporte à montagem automática de córpus a partir de textos da web e extração automática de termos. | pt_BR |
dc.title.alternative | Evaluation of support environments for automatic assembly of corpus from web texts and automatic extraction of terms. | pt_BR |
dc.type.category | Relatórios técnicos | pt_BR |
usp.description.abstracttranslated | The use of corpus is progressively becoming widespread in the areas of Linguistics, Natural Language Processing (PLN), Translation and Terminology, for to name a few. Although there is already a reasonable number of generic (or reference, as they are called) for several languages, the number of specific corpus support for terminological research, translation activities and evaluation of PLN resources is still deficient. While it is possible to construct such corpus by means of manual search in the this process is time-consuming if we take into account the benefits to unique searches. To meet this specific need for creation and research in these corpus types there are several projects that propose to provide environments for rapid creation of corpus and later research with them. One such project is Corpógrafo and another the BootCaT. The objectives of this research were the study and evaluation of the two environments for managing specialized corpus, to be tools, or their functionality, in the Portal USP Nanotechnology Network and in the project Automatic extraction of terms and elaboration collaborative terminology for the exchange of specialized knowledge, both of which being developed in the lnterinstitutional Center of Computational Linguistics. | pt_BR |