Avaliação de ambientes de suporte à montagem automática de córpus a partir de textos da web e extração automática de termos.

dc.contributorInstituto de Ciências Matemáticas e de Computação – ICMC/USPpt_BR
dc.contributor.authorGenovês Jr., Luiz Carlos
dc.contributor.authorAluisio, Sandra Maria
dc.date.accessioned2018-08-24T14:39:34Z
dc.date.available2018-08-24T14:39:34Z
dc.date.issued2005-10
dc.description.abstractA utilização de corpus está se generalizando progressivamente nas áreas da Linguística, do Processamento de Língua Natural (PLN), Tradução e Terminologia, para citar algumas. Embora já exista um número razoável de córpus genéricos (ou de referência,como são chamados) para várias línguas, o número de córpus específicos disponíveis para suporte à pesquisa terminológica, atividades de tradução e avaliação de recursos de PLN ainda é deficiente. Enquanto e' possível construir tais corpus por meio de busca manual na Web esse processo consome muito tempo se levarmos em conta os beneficios para pesquisas únicas. Para atender essa necessidade específica de criação e de pesquisa nesses tipos de corpus existem vários projetos que se propõem a disponibilizar ambientes para criação rápida de corpus e posterior pesquisa com eles. Um desses projetos é o Corpógrafo e outro o BootCaT. Os objetivos desta pesquisa foram o estudo e a avaliação dos dois ambientes acima mencionados para gerenciamento de córpus especializados, para serem utilizados, sejam suas próprias ferramentas ou a funcionalidade delas, no projeto Portal da Rede de Nanotecnologia da USP e no projeto Extração automática de termos e elaboração colaborativa de terminologias para o intercâmbio de conhecimento especializado, ambos sendo desenvolvidos no Núcleo lnterinstitucional de Linguística Computacional.pt_BR
dc.description.notesRelatórios Técnicos do ICMC; 266pt_BR
dc.format51 p.pt_BR
dc.identifier.urihttp://repositorio.icmc.usp.br//handle/RIICMC/6830
dc.language.isoporpt_BR
dc.publisher.citySão Carlos, SP, Brasil.pt_BR
dc.subjectLinguistica computacionalpt_BR
dc.titleAvaliação de ambientes de suporte à montagem automática de córpus a partir de textos da web e extração automática de termos.pt_BR
dc.title.alternativeEvaluation of support environments for automatic assembly of corpus from web texts and automatic extraction of terms.pt_BR
dc.type.categoryRelatórios técnicospt_BR
usp.description.abstracttranslatedThe use of corpus is progressively becoming widespread in the areas of Linguistics, Natural Language Processing (PLN), Translation and Terminology, for to name a few. Although there is already a reasonable number of generic (or reference, as they are called) for several languages, the number of specific corpus support for terminological research, translation activities and evaluation of PLN resources is still deficient. While it is possible to construct such corpus by means of manual search in the this process is time-consuming if we take into account the benefits to unique searches. To meet this specific need for creation and research in these corpus types there are several projects that propose to provide environments for rapid creation of corpus and later research with them. One such project is Corpógrafo and another the BootCaT. The objectives of this research were the study and evaluation of the two environments for managing specialized corpus, to be tools, or their functionality, in the Portal USP Nanotechnology Network and in the project Automatic extraction of terms and elaboration collaborative terminology for the exchange of specialized knowledge, both of which being developed in the lnterinstitutional Center of Computational Linguistics.pt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
relatorio_266.pdf
Tamanho:
15.56 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.29 KB
Formato:
Item-specific license agreed upon to submission
Descrição: