Avaliação de ambientes de suporte à montagem automática de córpus a partir de textos da web e extração automática de termos.

Genovês Jr., Luiz Carlos; Aluisio, Sandra Maria

Avaliação de ambientes de suporte à montagem automática de córpus a partir de textos da web e extração automática de termos.

dc.contributor	Instituto de Ciências Matemáticas e de Computação – ICMC/USP	pt_BR
dc.contributor.author	Genovês Jr., Luiz Carlos
dc.contributor.author	Aluisio, Sandra Maria
dc.date.accessioned	2018-08-24T14:39:34Z
dc.date.available	2018-08-24T14:39:34Z
dc.date.issued	2005-10
dc.description.abstract	A utilização de corpus está se generalizando progressivamente nas áreas da Linguística, do Processamento de Língua Natural (PLN), Tradução e Terminologia, para citar algumas. Embora já exista um número razoável de córpus genéricos (ou de referência,como são chamados) para várias línguas, o número de córpus específicos disponíveis para suporte à pesquisa terminológica, atividades de tradução e avaliação de recursos de PLN ainda é deficiente. Enquanto e' possível construir tais corpus por meio de busca manual na Web esse processo consome muito tempo se levarmos em conta os beneficios para pesquisas únicas. Para atender essa necessidade específica de criação e de pesquisa nesses tipos de corpus existem vários projetos que se propõem a disponibilizar ambientes para criação rápida de corpus e posterior pesquisa com eles. Um desses projetos é o Corpógrafo e outro o BootCaT. Os objetivos desta pesquisa foram o estudo e a avaliação dos dois ambientes acima mencionados para gerenciamento de córpus especializados, para serem utilizados, sejam suas próprias ferramentas ou a funcionalidade delas, no projeto Portal da Rede de Nanotecnologia da USP e no projeto Extração automática de termos e elaboração colaborativa de terminologias para o intercâmbio de conhecimento especializado, ambos sendo desenvolvidos no Núcleo lnterinstitucional de Linguística Computacional.	pt_BR
dc.description.notes	Relatórios Técnicos do ICMC; 266	pt_BR
dc.format	51 p.	pt_BR
dc.identifier.uri	http://repositorio.icmc.usp.br//handle/RIICMC/6830
dc.language.iso	por	pt_BR
dc.publisher.city	São Carlos, SP, Brasil.	pt_BR
dc.subject	Linguistica computacional	pt_BR
dc.title	Avaliação de ambientes de suporte à montagem automática de córpus a partir de textos da web e extração automática de termos.	pt_BR
dc.title.alternative	Evaluation of support environments for automatic assembly of corpus from web texts and automatic extraction of terms.	pt_BR
dc.type.category	Relatórios técnicos	pt_BR
usp.description.abstracttranslated	The use of corpus is progressively becoming widespread in the areas of Linguistics, Natural Language Processing (PLN), Translation and Terminology, for to name a few. Although there is already a reasonable number of generic (or reference, as they are called) for several languages, the number of specific corpus support for terminological research, translation activities and evaluation of PLN resources is still deficient. While it is possible to construct such corpus by means of manual search in the this process is time-consuming if we take into account the benefits to unique searches. To meet this specific need for creation and research in these corpus types there are several projects that propose to provide environments for rapid creation of corpus and later research with them. One such project is Corpógrafo and another the BootCaT. The objectives of this research were the study and evaluation of the two environments for managing specialized corpus, to be tools, or their functionality, in the Portal USP Nanotechnology Network and in the project Automatic extraction of terms and elaboration collaborative terminology for the exchange of specialized knowledge, both of which being developed in the lnterinstitutional Center of Computational Linguistics.	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: relatorio_266.pdf
Tamanho:: 15.56 MB
Formato:: Adobe Portable Document Format
Descrição:

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.29 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Publicações do ICMC