PreTexT II: descrição da reestruturação da ferramenta de pré-processamento de textos.

dc.contributorInstituto de Ciências Matemáticas e de Computação – ICMC/USPpt_BR
dc.contributor.authorSoares, Matheus Victor Brum
dc.contributor.authorPrati, Ronaldo C.
dc.contributor.authorMonard, Maria Carolina
dc.date.accessioned2018-03-16T13:46:22Z
dc.date.available2018-03-16T13:46:22Z
dc.date.issued2008-10
dc.description.abstractA quantidade de informação textual armazenada digitalmente vem crescendo a cada dia. No entanto, a nossa capacidade de processar e analisar essa informação não vem acompanhando este crescimento. Dessa maneira, é importante desenvolver processos semi-automáticos para extrair conhecimento relevante dessa informação, tais como o processo de mineração de textos. O pré-processamento de textos é uma das principais etapas da mineração de textos, e também uma das mais custosas. Essa etapa visa transformar texto não estruturado em um formato estruturado, como uma tabela atributo-valor. O PreTexT é uma ferramenta computacional que realiza esse tipo de pré-processamento utilizando funcionalidades como n-grama, stemming, stoplists, cortes por frequência, taxonomias, normalizações, gráficos, medidas tf , tf-idf , tf-linear , boolean, entre outras. Esta ferramenta passou por uma reestruturação e reimplementação recentemente e este trabalho consiste em apresentar as funcionalidades e o modo de uso da nova versão da ferramenta PreTexT.pt_BR
dc.description.notesRelatórios Técnicos do ICMC; 333pt_BR
dc.format45 p.pt_BR
dc.identifier.urihttp://repositorio.icmc.usp.br//handle/RIICMC/6708
dc.language.isoporpt_BR
dc.publisher.citySão Carlos, SP, Brasil.pt_BR
dc.subjectInteligência artificialpt_BR
dc.titlePreTexT II: descrição da reestruturação da ferramenta de pré-processamento de textos.pt_BR
dc.title.alternativePreTexT II: description of the restructuring of the preprocessing tool.pt_BR
dc.type.categoryRelatórios técnicospt_BR
usp.description.abstracttranslatedThe amount of digitally stored textual information has been growing each day. However, our ability to process and analyze this information has not kept pace with this growth. In this way, it is important semi-automated processes to extract relevant knowledge from information, such as the text mining process. The pr'e-processing of is one of the main stages of text mining, and is also one of the most important costly.This step aims to transform unstructured text into a structured format, as an attribute-value table. PreTexT is a computational tool which performs this type of pre-processing using functionalities such as n-gram, stemming, stoplists, frequency cutoffs, taxonomies, normalizations, graphs, measures tf, tf-idf, tf-linear, boolean, among others. This tool has restructuring and reimplementation recently and this work to present the functionalities and the way of using the new version of the tool PreTexT.pt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Relatório Técnico_333_2008.pdf
Tamanho:
714.87 KB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.29 KB
Formato:
Item-specific license agreed upon to submission
Descrição: