Web como um córpus versus córpus tradicionais: uma avaliação da aplicabilidade na construção da Wordnet.br.
dc.contributor | Instituto de Ciências Matemáticas e de Computação – ICMC/USP | pt_BR |
dc.contributor.author | Alves, Isa Mara da Rosa | |
dc.contributor.author | Aluisio, Sandra Maria | |
dc.date.accessioned | 2018-06-08T13:28:42Z | |
dc.date.available | 2018-06-08T13:28:42Z | |
dc.date.issued | 2006-01 | |
dc.description.abstract | O objetivo maior deste trabalho é verificar a metodologia mais adequada para a localização de frases que exemplifiquem os conceitos expressos por unidades lexicais polissêmicas do português do Brasil. Foi feita, portanto, uma análise das vantagens e limitações do uso da Web como um córpus versus os córpus tradicionais. Foram avaliados os recursos disponibilizados pela Linguateca para a manipulação do CórpusNilc, do WebCorp e do buscador Google. Tendo em vista que as diferentes áreas de estudo envolvidas nesta pesquisa - Semântica, Processamento Automático da Língua Natural (PLN) e Lingüística de Córpus -, a metodologia que norteia as reflexões aqui apresentadas fatora a busca de solução para o problema em dois dos domínios mutuamente complementares previstos em Dias-daSilva (1996; 1998; 2003): (i) lingüístico e (ii) lingüístico-computacional. Por se tratar de um trabalho exclusivamente de avaliação da usuabilidade de ferramentas e recursos computacionais disponíveis para auxiliar na tarefa de construção de uma base de dados lexicais do tipo wordnet, especificamente a Wordnet.Br, o terceiro domínio previsto pelo autor, o domínio computacional, não foi previsto. | pt_BR |
dc.description.notes | Relatórios Técnicos do ICMC; 268 | pt_BR |
dc.format | 42 p. | pt_BR |
dc.identifier.uri | http://repositorio.icmc.usp.br//handle/RIICMC/6719 | |
dc.language.iso | por | pt_BR |
dc.publisher.city | São Carlos, SP, Brasil. | pt_BR |
dc.subject | Linguistica computacional | pt_BR |
dc.title | Web como um córpus versus córpus tradicionais: uma avaliação da aplicabilidade na construção da Wordnet.br. | pt_BR |
dc.title.alternative | Web as a corpus versus traditional corpus: an evaluation of the applicability in the construction of Wordnet.br. | pt_BR |
dc.type.category | Relatórios técnicos | pt_BR |
usp.description.abstracttranslated | The main objective of this work is to verify the most adequate methodology for the localization of sentences that exemplify the concepts expressed by lexical units polysemic of Brazilian Portuguese. Therefore, an analysis of the advantages and limitations of Web use as a corpus versus the traditional corpus. The resources provided by Linguateca for the manipulation of CórpusNilc, WebCorp and of the Google search engine. Considering that the different areas of study involved in this Semantics, Automatic Processing of Natural Language (PLN) and Linguistics of Corpus -, the methodology that guides the reflections presented here leads to the search for a solution to the problem in two of the mutually complementary domains provided in Days-DaSilva (1996, 1998, 2003): (i) linguistic and (ii) linguistic-computational. Because it is a evaluation of the usability of tools and resources available to assist in the task of building a database Wordnet type, specifically to Wordnet.Br, the third domain provided by author, the computational domain, was not predicted. | pt_BR |