Extração de informação de referências bibliográficas usando POS-tagging.
dc.contributor | Instituto de Ciências Matemáticas e de Computação – ICMC/USP | pt_BR |
dc.contributor.author | Alvarez, Alberto Cáceres | |
dc.contributor.author | Lopes, Alneu de Andrade | |
dc.date.accessioned | 2018-08-20T10:59:35Z | |
dc.date.available | 2018-08-20T10:59:35Z | |
dc.date.issued | 2006-09 | |
dc.description.abstract | As técnicas relacionadas á área de extração de informações atuam sobre um conjunto de lados não estruturados e visam localizar informações relevantes em um documento ou coleção de documento, extrai-las e estrutura-las a fim de facilitar sua manipulação e análise. O objetivo específico deste projeto é induzir, de forma automática, um conjunto de regras para extração de informações das referências bibliográlicas de artigos cientííicos. A proposta para extrair automaticamente informações das referências, baseia-se no mapeamento do problema de part-of-speech (POS) tagging ao problema de Extração de Informação (EI). O mapeamento para a extração de informações de um texto consiste em, inicialmente, etiquetar todos os termos do texto, selecionando alguma etiqueta de um conjunto pré-definido de etiquetas e, posteriormente, combinar e extrair as informações de acordo com as etiquetas dos termos. Neste trabalho são apresentados os resultados da utilização desta abordagem para o problema da extração de informações de referências bibliográficas. | pt_BR |
dc.description.notes | Relatórios Técnicos do ICMC; 281 | pt_BR |
dc.format | 70 p. | pt_BR |
dc.identifier.uri | http://repositorio.icmc.usp.br//handle/RIICMC/6822 | |
dc.language.iso | por | pt_BR |
dc.publisher.city | São Carlos, SP, Brasil. | pt_BR |
dc.subject | Inteligência artificial | pt_BR |
dc.title | Extração de informação de referências bibliográficas usando POS-tagging. | pt_BR |
dc.title.alternative | Extraction of information from bibliographic references using POS-tagging. | pt_BR |
dc.type.category | Relatórios técnicos | pt_BR |
usp.description.abstracttranslated | The techniques related to the area of extraction of information act on a set of unstructured sides and aim to locate relevant information in a document or document collection, extract and structure them in order to facilitate its manipulation and analysis. The specific objective of this project is to automatically induce a set of rules for extracting information from bibliographical references of scientific articles. The proposal to automatically extract information from references, is based on the mapping of the part-of-speech (POS) tagging problem to the Information Extraction (EI) problem. The mapping for extracting information from a text consists of initially labeling all the terms of the text by selecting some label from a predefined set of labels and then combine and extract the information according to the term labels. This paper presents the results of using this approach to the problem of extracting information from bibliographic references. | pt_BR |