An account of the challenge of tagging a reference corpus of Brazilian Portuguese.

dc.contributorInstituto de Ciências Matemáticas e de Computação – ICMC/USPpt_BR
dc.contributor.authorAluisio, Sandra Maria
dc.contributor.authorPelizzoni, Jorge Marques
dc.contributor.authorMarchi, Ana Raquel
dc.contributor.authorOliveira, Lucélia Helena de
dc.contributor.authorManenti, Regiana
dc.contributor.authorMarquiafável, Vanessa
dc.contributor.authorTeles, Jorge
dc.date.accessioned2018-08-03T14:16:41Z
dc.date.available2018-08-03T14:16:41Z
dc.date.issued2003-02
dc.description.abstractThis article identifies and addresses the major issues faced in the manual morphosyntactic annotation of a huge corpus, named MAC-Morpho, a Brazilian Portuguese corpus of newspaper articles in the Lacio-Web Project. Rather than simply presenting the annotated corpus and describing its tagset, we elaborate on the criteria for establishing the tagset, make an account of how the annotation process was designed and conducted, including the results of the inter-annotator agreement evaluation for MAC-Morpho, and analyze some interesting cases amongst the linguistic problems we faced in this work.pt_BR
dc.description.notesRelatórios Técnicos do ICMC; 188pt_BR
dc.format18 p.pt_BR
dc.identifier.urihttp://repositorio.icmc.usp.br//handle/RIICMC/6798
dc.language.isoengpt_BR
dc.publisher.citySão Carlos, SP, Brasil.pt_BR
dc.subjectInteligência artificialpt_BR
dc.titleAn account of the challenge of tagging a reference corpus of Brazilian Portuguese.pt_BR
dc.title.alternativeUm relato do desafio de marcar um corpus de referência do português brasileiro.pt_BR
dc.type.categoryRelatórios técnicospt_BR
usp.description.abstracttranslatedEste artigo identifica e aborda as principais questões enfrentadas na anotação morfossintática manual de um corpus imenso, denominado MAC-Morpho, um corpus de artigos de jornais do Português Brasileiro no Projeto Lacio-Web. Em vez de simplesmente apresentar o corpus anotado e descrever seu conjunto de tags, elaboramos os critérios para estabelecer o conjunto de tags, explicamos como o processo de anotação foi projetado e conduzido, incluindo os resultados da avaliação do acordo entre os notificadores para MAC-Morpho, e analisar alguns casos interessantes entre os problemas linguísticos que enfrentamos neste trabalho.pt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Relatório Técnico_188_2003.pdf
Tamanho:
643.58 KB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.29 KB
Formato:
Item-specific license agreed upon to submission
Descrição: