Navegando por Autor "Maziero, Erick G."
Agora exibindo 1 - 5 de 5
Resultados por página
Opções de Ordenação
- ItemAnotação de aspectos textuais em sumários do córpus CSTNews.(2013-10) Rassi, Amanda P.; Zacarias, Andressa C.I.; Maziero, Erick G.; Souza, Jackson W.C.; DIas, Márcio S.; Jorge, Maria Lúcia R. Castro; Cardoso, Paula C.F.; Balage Filho, Pedro P.; Camargo, Renata T.; Agostini, Verônica; Felippo, Ariani di; Seno, Eloize R.M.; Rino, Lucia H.M.; Pardo, Thiago Alexandre SalgueiroNeste relatório técnico discorre-se sobre a anotação de aspectos textuais nos sumários manuais multidocumento do Córpus CSTNews. Esse córpus foi construído principalmente com vistas à Sumarização Automática Multidocumento. Ele é composto por coleções de textos jornalísticos provenientes de agências de notícias on-line conhecidas do Brasil. Especificamente, cada coleção contém em média 3 textos sobre um mesmo assunto, e cada texto advém de uma agência distinta. A partir do CSTNews, vários subcórpus foram construídos. Um deles é composto pelos sumários manuais elaborados para cada uma das coleções, ou seja, existe um sumário manual multidocumento para cada coleção. A anotação manual de aspectos foi feita para esses sumários multidocumento. Os aspectos em foco nessa anotação indicam diferentes tipos de informação que podem ser veiculados por um texto. Podem, por exemplo, referir-se a papéis semânticos como agente (quem), objeto (o que), modo (como), tempo (quando), etc., e, muitas vezes são dependentes do assunto, ou categoria à qual o texto pertence (p.ex.: esporte, mundo, etc.). Essa anotação dos sumários multidocumento do Córpus CSTNews visa trazer mais informatividade às tarefas automáticas, para melhorar sua qualidade. Para a Sumarização Automática Multidocumento, os aspectos podem indicar estruturas padrão (templates) para a modelagem de critérios de seleção e organização do conteúdo nos sumários.
- ItemAnotação de sentidos de verbos no córpus CSTNews.(2014-12) Cabezudo, Marco A. Sobrevilla; Maziero, Erick G.; Souza, Jackson W.C.; Dias, Márcio S.; Cardoso, Paula C.F.; Balage Filho, Pedro P.; Agostini, Verônica; Nóbrega, Fernando A.A.; Barros, Cláudia D.; Felippo, Ariani di; Pardo, Thiago Alexandre SalgueiroUm dos desafios do Processamento das Línguas Naturais (PLN) em nível semântico é a ambiguidade lexical, já que as palavras podem expressar significados distintos em função do contexto em que ocorrem.
- ItemAnotação de subtópicos do córpus multidocumento CSTNews.(2012-12) Cardoso, Paula C.F.; Rassi, Amanda P.; Maziero, Erick G.; Nóbrega, Fernando A.A.; Souza, Jackson W.C.; Dias, Márcio S.; Jorge, Maria Lúcia R. Castro; Balage Filho, Pedro P.; Camargo, Renata T.; Agostini, Verônica; Felippo, Ariani di; Rino, Lucia H.M.; Pardo, Thiago Alexandre SalgueiroA segmentação topical visa a dividir um texto em segmentos topicalmente coerentes. Esse procedimento pode ser muito útil para aplicações de Processamento de Linguagem Natural, tais como recuperação de informação, sumarização automática e sistemas de perguntas e respostas. Assume-se que um texto tem um tópico principal, que é o assunto sobre o qual se escreve ou discute, e que esse assunto pode ser descrito em uma sequência de subtópicos. Tais subtópicos podem mudar continuamente, sendo que algumas mudanças são mais sutis do que outras. Visando criar uma segmentação de subtópicos de referência, este relatório descreve o processo de anotação de subtópicos do córpus CSTNews, um córpus multidocumento de notícias jornalísticas em português do Brasil. As diretrizes de anotação e seus resultados são apresentados e discutidos. Esta segmentação foi desenvolvida para fins de investigação na área de Sumarização Automática de textos.
- ItemFerramenta de análise automática de inteligibilidade de córpus (AIC)(2008-07) Maziero, Erick G.; Pardo, Thiago Alexandre Salgueiro; Aluisio, Sandra MariaApresenta-se, neste relatório, uma ferramenta de análise automática de inteligibilidade de córpus chamada AIC. A ferramenta extrai automaticamente diversos atributos de textos, baseando-se na anotação sintática dos textos produzida pelo sistema PALAVRAS. A AIC foi desenvolvida para o projeto PorSimples (Simplificação Textual do Português para Inclusão e Acessibilidade Digital), mas pode ser usada para os mais variados fins.
- ItemIdentificação automática de segmentos discursivos: o uso do parser PALAVRAS.(2007-08) Maziero, Erick G.; Pardo, Thiago Alexandre Salgueiro; Nunes, Maria das Graças VolpeO processo de segmentação textual é uma tarefa prévia para a maior parte das aplicações de Processamento de Língua Natural (PLN), sendo que tarefas diferentes exigem segmentos com granularidades diferentes. Este trabalho visa à produção de segmentos que encerrem em si uma idéia ou conceito básico do texto, os quais são ideais a uma análise retórica/discursiva do texto. Mais especificamente, aborda-se a RST (Rhetorical Structure Theory), uma das teorias discursivas mais utilizadas atualmente. O método de segmentação aqui exposto será incorporado ao sistema DiZer (DIscourse analyZER for BRazilian Portuguese), substituindo sua etapa de segmentação textual, objetivando melhor desempenho deste analisador retórico automático pioneiro para o português do Brasil. O método apresentado baseia-se em informações morfossintáticas produzidas pelo parser PALAVRAS, um dos melhores analisadores para o português do Brasil.