An account of the challenge of tagging a reference corpus of Brazilian Portuguese.

dc.contributorInstituto de Ciências Matemáticas e de Computação – ICMC/USPpt_BR
dc.contributor.authorAluisio, Sandra Maria
dc.contributor.authorPelizzoni, Jorge Marques
dc.contributor.authorMarchi, Ana Raquel
dc.contributor.authorOliveira, Lucélia Helena de
dc.contributor.authorManenti, Regiana
dc.contributor.authorMarquiafável, Vanessa
dc.contributor.authorTeles, Jorge
dc.date.accessioned2019-02-06T10:34:39Z
dc.date.available2019-02-06T10:34:39Z
dc.date.issued2003-02
dc.description.abstractThis article identifies and addresses the major issues faced in the manual morphosyntactic annotation of a huge corpus, named MACMorpho, a Brazilian Portuguese corpus of newspaper articles in the Lacie-Web Project. Rather than simply presenting the annotated corpus and describing its tagset, we elaborate on the criteria for establishing the tagset, make an account of how the annotation process was designed and conducted, including the results of the inter-annotator agreement evaluation for MAC-Morpho, and analyze some interesting cases amongst the linguistic problems we faced in this work.pt_BR
dc.description.notesRelatórios Técnicos do ICMC; 188pt_BR
dc.format18 p.pt_BR
dc.identifier.urihttp://repositorio.icmc.usp.br//handle/RIICMC/6881
dc.language.isoengpt_BR
dc.publisher.citySão Carlos, SP, Brasil.pt_BR
dc.subjectInteligência artificialpt_BR
dc.titleAn account of the challenge of tagging a reference corpus of Brazilian Portuguese.pt_BR
dc.title.alternativeUm relato do desafio de marcar um corpus de referência do português brasileiro.pt_BR
dc.type.categoryRelatórios técnicospt_BR
usp.description.abstracttranslatedEste artigo identifica e aborda as principais questões enfrentadas no anotação morfossintática manual de um enorme corpus, denominado MACMorpho, um corpus de artigos de jornais portugueses do Brasil no Lacie - Projeto da Web. Em vez de simplesmente apresentar o corpus anotado e descrevendo seu conjunto de tags, elaboramos os critérios para estabelecer o tagset, faça uma conta de como o processo de anotação foi projetado e conduzido, incluindo os resultados do contrato de inter-anotação avaliação para MAC-Morpho, e analisar alguns casos interessantes entre os problemas linguísticos que enfrentamos neste trabalho.pt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
relatorio_188.pdf
Tamanho:
8.22 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.29 KB
Formato:
Item-specific license agreed upon to submission
Descrição: