Manual para marcação de alinhamentos lexícais.

dc.contributorInstituto de Ciências Matemáticas e de Computação – ICMC/USPpt_BR
dc.contributor.authorCaseli, Helena de Medeiros
dc.contributor.authorScalco, Miriam Antunes Gonçalves
dc.contributor.authorNunes, Maria das Graças Volpe
dc.date.accessioned2018-08-29T16:48:39Z
dc.date.available2018-08-29T16:48:39Z
dc.date.issued2005-04
dc.description.abstractEste relatório apresenta as diretrizes definidas, no âmbito do projeto ReTraTos, para o processo de alinhamento lexical de textos paralelos escritos em Português do Brasil, Espanhol e Inglês. Os textos paralelos e sua versão alinhada são, ambos, de grande importância para diversas aplicações de Processamento de Línguas Naturais (PLN), como: aprendizado de regras de tradução (objetivo do projeto ReTraTos), Ezample-Based Machine Translation (EBMT), Statistical Machine Translation (SMT), extração de léxicos bilingues, desambiguação lexical de sentido, entre outras. As diretrizes aqui apresentadas possibilitaram a criação de córpus paralelos alinhados lexicalmente que seguem padrões bem definidos eliminando, assim, um grande número de ambiguidades inerentes do processo de alinhamento. Tanto os córpus quanto as diretrizes produzidos neste trabalho poderão ser utilizados em projetos futuros para a produção de ferramentas e recursos para o Processamento de Linguagem Natural.pt_BR
dc.description.notesRelatórios Técnicos do ICMC; 256pt_BR
dc.format21 p.pt_BR
dc.identifier.urihttp://repositorio.icmc.usp.br//handle/RIICMC/6835
dc.language.isoporpt_BR
dc.publisher.citySão Carlos, SP, Brasil.pt_BR
dc.subjectLinguistica computacionalpt_BR
dc.titleManual para marcação de alinhamentos lexícais.pt_BR
dc.title.alternativeManual for marking of alignments.pt_BR
dc.type.categoryRelatórios técnicospt_BR
usp.description.abstracttranslatedThis report presents the guidelines defined, within the framework of the ReTraTos project, for the lexical alignment process of parallel texts written in Brazilian Portuguese, Spanish and English. Parallel texts and their aligned version are both of great importance for various applications of Natural Language Processing (PLN), such as: learning of translation rules (objective of the ReTraTos project), Ezample-Based Machine Translation (EBMT), Statistical Machine Translation (SMT), extraction of bilingual lexicons, lexical meaning disambiguation, among others. The guidelines presented here allowed the creation of lexical parallel aligned corpus that follows well defined patterns, thus eliminating a large number of inherent ambiguities of the alignment process. Both the corpus and the guidelines produced in this work can be used in future projects for the production of tools and resources for Natural Language Processing.pt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
relatorio_256.pdf
Tamanho:
5.84 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.29 KB
Formato:
Item-specific license agreed upon to submission
Descrição: