Web como um córpus versus córpus tradicionais: uma avaliação da aplicabilidade na construção da Wordnet.br.

dc.contributorInstituto de Ciências Matemáticas e de Computação – ICMC/USPpt_BR
dc.contributor.authorAlves, Isa Mara da Rosa
dc.contributor.authorAluisio, Sandra Maria
dc.date.accessioned2018-06-08T13:28:42Z
dc.date.available2018-06-08T13:28:42Z
dc.date.issued2006-01
dc.description.abstractO objetivo maior deste trabalho é verificar a metodologia mais adequada para a localização de frases que exemplifiquem os conceitos expressos por unidades lexicais polissêmicas do português do Brasil. Foi feita, portanto, uma análise das vantagens e limitações do uso da Web como um córpus versus os córpus tradicionais. Foram avaliados os recursos disponibilizados pela Linguateca para a manipulação do CórpusNilc, do WebCorp e do buscador Google. Tendo em vista que as diferentes áreas de estudo envolvidas nesta pesquisa - Semântica, Processamento Automático da Língua Natural (PLN) e Lingüística de Córpus -, a metodologia que norteia as reflexões aqui apresentadas fatora a busca de solução para o problema em dois dos domínios mutuamente complementares previstos em Dias-daSilva (1996; 1998; 2003): (i) lingüístico e (ii) lingüístico-computacional. Por se tratar de um trabalho exclusivamente de avaliação da usuabilidade de ferramentas e recursos computacionais disponíveis para auxiliar na tarefa de construção de uma base de dados lexicais do tipo wordnet, especificamente a Wordnet.Br, o terceiro domínio previsto pelo autor, o domínio computacional, não foi previsto.pt_BR
dc.description.notesRelatórios Técnicos do ICMC; 268pt_BR
dc.format42 p.pt_BR
dc.identifier.urihttp://repositorio.icmc.usp.br//handle/RIICMC/6719
dc.language.isoporpt_BR
dc.publisher.citySão Carlos, SP, Brasil.pt_BR
dc.subjectLinguistica computacionalpt_BR
dc.titleWeb como um córpus versus córpus tradicionais: uma avaliação da aplicabilidade na construção da Wordnet.br.pt_BR
dc.title.alternativeWeb as a corpus versus traditional corpus: an evaluation of the applicability in the construction of Wordnet.br.pt_BR
dc.type.categoryRelatórios técnicospt_BR
usp.description.abstracttranslatedThe main objective of this work is to verify the most adequate methodology for the localization of sentences that exemplify the concepts expressed by lexical units polysemic of Brazilian Portuguese. Therefore, an analysis of the advantages and limitations of Web use as a corpus versus the traditional corpus. The resources provided by Linguateca for the manipulation of CórpusNilc, WebCorp and of the Google search engine. Considering that the different areas of study involved in this Semantics, Automatic Processing of Natural Language (PLN) and Linguistics of Corpus -, the methodology that guides the reflections presented here leads to the search for a solution to the problem in two of the mutually complementary domains provided in Days-DaSilva (1996, 1998, 2003): (i) linguistic and (ii) linguistic-computational. Because it is a evaluation of the usability of tools and resources available to assist in the task of building a database Wordnet type, specifically to Wordnet.Br, the third domain provided by author, the computational domain, was not predicted.pt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Relatório Técnico_268_2006.pdf
Tamanho:
3.18 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.29 KB
Formato:
Item-specific license agreed upon to submission
Descrição: