Anotação de aspectos textuais em sumários do córpus CSTNews.

dc.contributorInstituto de Ciências Matemáticas e de Computação – ICMC/USPpt_BR
dc.contributor.authorRassi, Amanda P.
dc.contributor.authorZacarias, Andressa C.I.
dc.contributor.authorMaziero, Erick G.
dc.contributor.authorSouza, Jackson W.C.
dc.contributor.authorDIas, Márcio S.
dc.contributor.authorJorge, Maria Lúcia R. Castro
dc.contributor.authorCardoso, Paula C.F.
dc.contributor.authorBalage Filho, Pedro P.
dc.contributor.authorCamargo, Renata T.
dc.contributor.authorAgostini, Verônica
dc.contributor.authorFelippo, Ariani di
dc.contributor.authorSeno, Eloize R.M.
dc.contributor.authorRino, Lucia H.M.
dc.contributor.authorPardo, Thiago Alexandre Salgueiro
dc.date.accessioned2017-12-14T15:13:24Z
dc.date.available2017-12-14T15:13:24Z
dc.date.issued2013-10
dc.description.abstractNeste relatório técnico discorre-se sobre a anotação de aspectos textuais nos sumários manuais multidocumento do Córpus CSTNews. Esse córpus foi construído principalmente com vistas à Sumarização Automática Multidocumento. Ele é composto por coleções de textos jornalísticos provenientes de agências de notícias on-line conhecidas do Brasil. Especificamente, cada coleção contém em média 3 textos sobre um mesmo assunto, e cada texto advém de uma agência distinta. A partir do CSTNews, vários subcórpus foram construídos. Um deles é composto pelos sumários manuais elaborados para cada uma das coleções, ou seja, existe um sumário manual multidocumento para cada coleção. A anotação manual de aspectos foi feita para esses sumários multidocumento. Os aspectos em foco nessa anotação indicam diferentes tipos de informação que podem ser veiculados por um texto. Podem, por exemplo, referir-se a papéis semânticos como agente (quem), objeto (o que), modo (como), tempo (quando), etc., e, muitas vezes são dependentes do assunto, ou categoria à qual o texto pertence (p.ex.: esporte, mundo, etc.). Essa anotação dos sumários multidocumento do Córpus CSTNews visa trazer mais informatividade às tarefas automáticas, para melhorar sua qualidade. Para a Sumarização Automática Multidocumento, os aspectos podem indicar estruturas padrão (templates) para a modelagem de critérios de seleção e organização do conteúdo nos sumários.pt_BR
dc.description.notesRelatórios Técnicos do ICMC; 394pt_BR
dc.format59 p.pt_BR
dc.identifier.urihttp://repositorio.icmc.usp.br//handle/RIICMC/6676
dc.language.isoporpt_BR
dc.publisher.citySão Carlos, SP, Brasil.pt_BR
dc.subjectLinguística de corpuspt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.titleAnotação de aspectos textuais em sumários do córpus CSTNews.pt_BR
dc.title.alternativeAnnotation of textual aspects in summaries of the CSTNews corpus.pt_BR
dc.type.categoryRelatórios técnicospt_BR
usp.description.abstracttranslatedThis technical report deals with the annotation of textual aspects in the Corpus CSTNews manuals multidocument summaries. This corpus was built primarily for Automatic Summarization Multidocument...pt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Relatórios Técnicos_394_2013.pdf
Tamanho:
738.44 KB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.29 KB
Formato:
Item-specific license agreed upon to submission
Descrição: