Projeto TraSem: a investigação empirica sobre o problema da ambiguidade categorial.
Arquivos
Data
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Este relatório dá sequência ao relatório técnico NILC-TR-O1-1 (Rino et al., 2001), o qual, a partir da exploração teórica dos problemas de especificação semântica para melhorar o desempenho do ReGra, aponta a necessidade de se analisar mais profundamente suas ocorrências de diagnósticos inadequados. A partir do estudo teórico, sugerimos uma metodologia empírica, fundamentada na busca de subsídios estatísticos sobre o corpus do NlLC. É esta tarefa, de exploração dos dados lexicais, que descrevemos aqui. Mais particularmente, concentramo-nos, primeiramente, no refinamento das especificações do léxico do ReGra, observando que muitos dos problemas de diagnóstico remetiam a inadequações já existentes no próprio léxico. A partir desse refinamento, a proposta é proceder à análise linguistica do corpus do NILC, etiquetado, com o objetivo de determinar padrões sintáticos que permitam tratar os casos de ambiguidade categorial.