Navegando por Autor "Rino, Lucia H.M."
Agora exibindo 1 - 4 de 4
Resultados por página
Opções de Ordenação
- ItemAnotação de aspectos textuais em sumários do córpus CSTNews.(2013-10) Rassi, Amanda P.; Zacarias, Andressa C.I.; Maziero, Erick G.; Souza, Jackson W.C.; DIas, Márcio S.; Jorge, Maria Lúcia R. Castro; Cardoso, Paula C.F.; Balage Filho, Pedro P.; Camargo, Renata T.; Agostini, Verônica; Felippo, Ariani di; Seno, Eloize R.M.; Rino, Lucia H.M.; Pardo, Thiago Alexandre SalgueiroNeste relatório técnico discorre-se sobre a anotação de aspectos textuais nos sumários manuais multidocumento do Córpus CSTNews. Esse córpus foi construído principalmente com vistas à Sumarização Automática Multidocumento. Ele é composto por coleções de textos jornalísticos provenientes de agências de notícias on-line conhecidas do Brasil. Especificamente, cada coleção contém em média 3 textos sobre um mesmo assunto, e cada texto advém de uma agência distinta. A partir do CSTNews, vários subcórpus foram construídos. Um deles é composto pelos sumários manuais elaborados para cada uma das coleções, ou seja, existe um sumário manual multidocumento para cada coleção. A anotação manual de aspectos foi feita para esses sumários multidocumento. Os aspectos em foco nessa anotação indicam diferentes tipos de informação que podem ser veiculados por um texto. Podem, por exemplo, referir-se a papéis semânticos como agente (quem), objeto (o que), modo (como), tempo (quando), etc., e, muitas vezes são dependentes do assunto, ou categoria à qual o texto pertence (p.ex.: esporte, mundo, etc.). Essa anotação dos sumários multidocumento do Córpus CSTNews visa trazer mais informatividade às tarefas automáticas, para melhorar sua qualidade. Para a Sumarização Automática Multidocumento, os aspectos podem indicar estruturas padrão (templates) para a modelagem de critérios de seleção e organização do conteúdo nos sumários.
- ItemAnotação de subtópicos do córpus multidocumento CSTNews.(2012-12) Cardoso, Paula C.F.; Rassi, Amanda P.; Maziero, Erick G.; Nóbrega, Fernando A.A.; Souza, Jackson W.C.; Dias, Márcio S.; Jorge, Maria Lúcia R. Castro; Balage Filho, Pedro P.; Camargo, Renata T.; Agostini, Verônica; Felippo, Ariani di; Rino, Lucia H.M.; Pardo, Thiago Alexandre SalgueiroA segmentação topical visa a dividir um texto em segmentos topicalmente coerentes. Esse procedimento pode ser muito útil para aplicações de Processamento de Linguagem Natural, tais como recuperação de informação, sumarização automática e sistemas de perguntas e respostas. Assume-se que um texto tem um tópico principal, que é o assunto sobre o qual se escreve ou discute, e que esse assunto pode ser descrito em uma sequência de subtópicos. Tais subtópicos podem mudar continuamente, sendo que algumas mudanças são mais sutis do que outras. Visando criar uma segmentação de subtópicos de referência, este relatório descreve o processo de anotação de subtópicos do córpus CSTNews, um córpus multidocumento de notícias jornalísticas em português do Brasil. As diretrizes de anotação e seus resultados são apresentados e discutidos. Esta segmentação foi desenvolvida para fins de investigação na área de Sumarização Automática de textos.
- ItemProjeto TraSem: A investigação teórica sobre o problema da ambiguidade categorial.(2001-04) Rino, Lucia H.M.; Martins, Ronaldo Teixeira; Marchi, Ana Raquel; Kuhn, Denise Campos e Silva; Pinheiro, Gisele Montilha; Pardo, Thiago Alexandre Salgueiro; Di Felippo, Ariani; Nunes, Maria das Graças VolpeEste relatório descreve a investigação teórica do problema proposto inicialmente no subprojeto “Especificação dos Traços Semânticos dos Itens Lexicais”, cujo trabalho se iniciou em Março/99, estendendo-se até meados de 2000, com a implementação de um protótipo visando o aprimoramento do ReGra. A decisão pela prototipagem teve por objetivo, inicialmente, buscar caminhos para a avaliação da adoção de uma estratégia de aprimoramento baseada nas teorias investigadas. Após alguns meses de desenvolvimento do protótipo e sua conseqüente avaliação, decidiu-se adotar outra metodologia de investigação, agora empírica, com base na exploração do corpus do NILC. Além de descrever a abordagem teórica, apresentamos aqui as razões para a mudança de abordagem.
- ItemAs regras gramaticais para a decodificação UNL-Português no projeto UNL.(1998) Martins, Ronaldo T.; Rino, Lucia H.M.; Nunes, Maria das Graças VolpeEste relatório descreve o conjunto de regras gramaticais para a decodificação UNL-português utilizando DeCoL 1.0 (Deconverter System for Latin Languages, versão 1.0), o decodificador disponibilizado pelo UNL Center. Esse conjunto foi especificado com base em dois corpora experimentais, que compreendem vinte sentenças do booklet de apresentação da Linguagem UNL e os capítulos XIV e XV da Carta das Nações Unidas. Sendo assim, as regras contemplam uma parte significativa (porém, incompleta) de todos os possíveis aspectos gramaticais da língua portuguesa. Elas são divididas em três grupos, que abordam aspectos distintos do processamento lingüístico: o tratamento semântico e, portanto, a inserção de itens lexicais em uma sentença, o tratamento sintático, ou seja, o intra-relacionamento entre tais itens na sentença e o tratamento morfológico, basicamente compreendendo a sufixação de palavras. Regras de processamento gráfico para o DeCoL também são definidas.