Mineração de textos : aplicação nas monografias de gestão da informação (2002-2008)
Resumo
Resumo: Estudo exploratório sobre Mineração de Textos na produção discente universitária. Aplica tarefa de agrupamento nas monografias de Gestão da Informação, da Universidade Federal do Paraná, apresentadas do ano de 2002 a 2008. Contextualiza o problema do overload informacional por meio de prospecções de crescimento de dados e informações digitais. Justifica com este argumento a importância das técnicas apresentadas para redução deste problema. Aponta a necessidade de saber mensurar o valor da informação com a afirmação de que o ciclo da informação pode orientar profissionais da informação nesta atividade. Mostra as relações da Mineração de Textos com outras áreas. Demonstra todo o processo de Mineração de Textos por meio de uma abordagem completa englobando semântica e estatística. Busca software proprietários, livres e open source de Mineração de Textos relacionando 62 software. Reduz este número para 2 software após análise de quesitos como: disponibilidade para download, necessidades prévias limitadoras e funcionamento do software. Aplica as técnicas de Mineração de Textos em uma base com textos completos e em outra base de resumos. Utiliza o software Rapidminer e o módulo WORDSTAT para a tarefa proposta. Compara os resultados gerados pelo software Rapidminer, identificando que o melhor resultado ocorre na base de resumos, na qual a taxa de acerto é de 80% e o agrupamento é feito em 3 grupos. Apresenta resultados do WORDSTAT sem avaliá-lo, devido a falta de medidas de mensuração. Relativiza o processo de Mineração de Textos com o ciclo de vida da informação. Encontra similaridades e possíveis aplicações. Propõe um levantamento de práticas, técnicas e ferramentas com base no modelo criado. Conclui que dos softwares testados o melhor para a prática acadêmica é o Rapidminer. Comenta as dificuldades encontradas no aprendizado e uso dos software e na falta de algoritmos voltados à língua portuguesa. Identifica a incipiência do mercado brasileiro frente a soluções de Mineração de Textos e aponta como uma área de crescimento promissor e passível de atuação para o Gestor da Informação. Sugere como estudos futuros a aplicação das demais tarefas de mineração, o melhoramento de testes de parâmetros para a tarefa de agrupamento, bem como a comparação com outros algoritmos e base textuais.
Collections
- Gestão da Informação [558]