Best sports: a portuguese collection of documents for semantics-concerned text mining research.

dc.contributorInstituto de Ciências Matemáticas e de Computação – ICMC/USPpt_BR
dc.contributor.authorSinoara, Roberta Akemi
dc.contributor.authorRezende, Solange Oliveira
dc.date.accessioned2018-04-05T17:16:44Z
dc.date.available2018-04-05T17:16:44Z
dc.date.issued2018-04
dc.description.abstractThe availability of labeled text collections is a common need in the text mining research community. These collections are used for both learning and evaluating text mining models. In this technical report, we present the BEST sports collection. This collection of documents written in Portuguese was collected, prepared, and provided to be used as benchmarking collection in text mining research. Considering real application scenarios, we created four datasets, which correspond to problems of different semantic complexity levels. The use of different datasets of the same collection allows the evaluation of text mining methods at different levels of semantic complexity.pt_BR
dc.description.notesRelatórios Técnicos do ICMC; 424pt_BR
dc.format11 p.pt_BR
dc.identifier.urihttp://repositorio.icmc.usp.br//handle/RIICMC/6710
dc.language.isoengpt_BR
dc.publisher.citySão Carlos, SP, Brasil.pt_BR
dc.subjectMineração de dados e textospt_BR
dc.subjectAprendizado de máquinapt_BR
dc.titleBest sports: a portuguese collection of documents for semantics-concerned text mining research.pt_BR
dc.title.alternativeBest sports: uma coleção de documentos em língua-portuguesa para pesquisa em mineração semântica de texto.pt_BR
dc.type.categoryRelatórios técnicospt_BR
usp.description.abstracttranslatedA disponibilidade de coleções de texto classificadas é uma necessidade comum na comunidade de pesquisa em mineração de texto. Essas coleções são usadas para aprender e avaliar modelos de mineração de texto. Neste relatório técnico, apresentamos a coleção BEST sports. Esta coleção de documentos escritos em português foi coletada, preparada e fornecida para ser utilizada como a coleção de benchmarking na pesquisa de mineração de texto. Considerando cenários reais de aplicação, criamos quatro conjuntos de dados, que correspondem a problemas de diferentes níveis de complexidade semântica. O uso de diferentes conjuntos de dados da mesma coleção permite a avaliação de métodos de mineração de texto em diferentes níveis de complexidade semântica.pt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
RELATORIOS_TECNICOS_ICMC_424_2018.pdf
Tamanho:
4.12 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.29 KB
Formato:
Item-specific license agreed upon to submission
Descrição: