Descrição de uma metodologia de mapeamento de informações não estruturadas em uma representação atributo-valor.
dc.contributor | Instituto de Ciências Matemáticas e de Computação – ICMC/USP | pt_BR |
dc.contributor.author | Honorato, Daniel de Faveri | |
dc.contributor.author | Monard, Maria Carolina | |
dc.date.accessioned | 2018-06-08T14:18:21Z | |
dc.date.available | 2018-06-08T14:18:21Z | |
dc.date.issued | 2008-02 | |
dc.description.abstract | O processo de Mineração de Textos auxilia na extração de padrões de conjunto de documentos de textos. Freqüentemente, esse processo requer que os dados encontrem-se armazenados em uma tabela atributo-valor. Neste trabalho é apresentado uma descrição detalhada de uma metodologia desenvolvida para auxiliar no mapeamento de informações não estruturadas encontradas em um conjunto de documentos textuais nos quais o vocabulário utilizado é bastante controlado, tais como em laudos médicos, em informações estruturadas representadas em uma tabela atributo-valor. Para auxiliar na construção dos atributos dessa tabela, é utilizada uma abordagem híbrida de extração de terminologia para identificar unidades terminológicas no conjunto de documentos processados. | pt_BR |
dc.description.notes | Relatórios Técnicos do ICMC; 317 | pt_BR |
dc.format | 68 p. | pt_BR |
dc.identifier.uri | http://repositorio.icmc.usp.br//handle/RIICMC/6734 | |
dc.language.iso | por | pt_BR |
dc.publisher.city | São Carlos, SP, Brasil. | pt_BR |
dc.subject | Inteligência artificial | pt_BR |
dc.title | Descrição de uma metodologia de mapeamento de informações não estruturadas em uma representação atributo-valor. | pt_BR |
dc.title.alternative | Description of a methodology for mapping unstructured information into an attribute-value representation. | pt_BR |
dc.type.category | Relatórios técnicos | pt_BR |
usp.description.abstracttranslated | The Text Mining process helps in extracting patterns of set of text documents. Frequently, this process requires that the data be stored in an attribute-value table. This paper presents a detailed description of a methodology developed to assist in the mapping of unstructured information found in a set of textual documents in which the vocabulary used is quite controlled, such as medical reports, structured information represented in an attribute- value. To assist in the construction of the attributes of this table, a terminology extraction approach to identify terminology in the set of documents processed. | pt_BR |