Web como um córpus versus córpus tradicionais: uma avaliação da aplicabilidade na construção da Wordnet.br.
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
O objetivo maior deste trabalho é verificar a metodologia mais adequada para a localização de frases que exemplifiquem os conceitos expressos por unidades lexicais polissêmicas do português do Brasil. Foi feita, portanto, uma análise das vantagens e limitações do uso da Web como um córpus versus os córpus tradicionais. Foram avaliados os recursos disponibilizados pela Linguateca para a manipulação do CórpusNilc, do WebCorp e do buscador Google. Tendo em vista que as diferentes áreas de estudo envolvidas nesta pesquisa - Semântica, Processamento Automático da Língua Natural (PLN) e Lingüística de Córpus -, a metodologia que norteia as reflexões aqui apresentadas fatora a busca de solução para o problema em dois dos domínios mutuamente complementares previstos em Dias-daSilva (1996; 1998; 2003): (i) lingüístico e (ii) lingüístico-computacional. Por se tratar de um trabalho exclusivamente de avaliação da usuabilidade de ferramentas e recursos computacionais disponíveis para auxiliar na tarefa de construção de uma base de dados lexicais do tipo wordnet, especificamente a Wordnet.Br, o terceiro domínio previsto pelo autor, o domínio computacional, não foi previsto.