Mineração de textos : aplicação nas monografias de gestão da informação (2002-2008)

Busemeyer, Cassius Guimarães

dc.contributor.advisor	Tsunoda, Denise Fukumi, 1972-	pt_BR
dc.contributor.other	Universidade Federal do Paraná. Setor de Ciências Sociais Aplicadas. Curso de Graduação em Gestão da Informação	pt_BR
dc.creator	Busemeyer, Cassius Guimarães	pt_BR
dc.date.accessioned	2024-02-29T15:22:46Z
dc.date.available	2024-02-29T15:22:46Z
dc.date.issued	2009	pt_BR
dc.identifier.uri	https://hdl.handle.net/1884/48147
dc.description	Orientador: Denise Fukumu Tsunoda	pt_BR
dc.description	Monografia(Graduação) - Universidade Federal do Paraná,Setor de Ciências Sociais Aplicadas, Curso de Gestão da Informação	pt_BR
dc.description	Inclui referências	pt_BR
dc.description.abstract	Resumo: Estudo exploratório sobre Mineração de Textos na produção discente universitária. Aplica tarefa de agrupamento nas monografias de Gestão da Informação, da Universidade Federal do Paraná, apresentadas do ano de 2002 a 2008. Contextualiza o problema do overload informacional por meio de prospecções de crescimento de dados e informações digitais. Justifica com este argumento a importância das técnicas apresentadas para redução deste problema. Aponta a necessidade de saber mensurar o valor da informação com a afirmação de que o ciclo da informação pode orientar profissionais da informação nesta atividade. Mostra as relações da Mineração de Textos com outras áreas. Demonstra todo o processo de Mineração de Textos por meio de uma abordagem completa englobando semântica e estatística. Busca software proprietários, livres e open source de Mineração de Textos relacionando 62 software. Reduz este número para 2 software após análise de quesitos como: disponibilidade para download, necessidades prévias limitadoras e funcionamento do software. Aplica as técnicas de Mineração de Textos em uma base com textos completos e em outra base de resumos. Utiliza o software Rapidminer e o módulo WORDSTAT para a tarefa proposta. Compara os resultados gerados pelo software Rapidminer, identificando que o melhor resultado ocorre na base de resumos, na qual a taxa de acerto é de 80% e o agrupamento é feito em 3 grupos. Apresenta resultados do WORDSTAT sem avaliá-lo, devido a falta de medidas de mensuração. Relativiza o processo de Mineração de Textos com o ciclo de vida da informação. Encontra similaridades e possíveis aplicações. Propõe um levantamento de práticas, técnicas e ferramentas com base no modelo criado. Conclui que dos softwares testados o melhor para a prática acadêmica é o Rapidminer. Comenta as dificuldades encontradas no aprendizado e uso dos software e na falta de algoritmos voltados à língua portuguesa. Identifica a incipiência do mercado brasileiro frente a soluções de Mineração de Textos e aponta como uma área de crescimento promissor e passível de atuação para o Gestor da Informação. Sugere como estudos futuros a aplicação das demais tarefas de mineração, o melhoramento de testes de parâmetros para a tarefa de agrupamento, bem como a comparação com outros algoritmos e base textuais.	pt_BR
dc.format.extent	1 recurso online : PDF.	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language	Português	pt_BR
dc.subject	Mineração de dados (Computação)	pt_BR
dc.subject	Recuperação da informação	pt_BR
dc.subject	Recuperação de dados (Computação)	pt_BR
dc.subject	Analise por conglomerados	pt_BR
dc.title	Mineração de textos : aplicação nas monografias de gestão da informação (2002-2008)	pt_BR
dc.type	TCC Graduação Digital	pt_BR

Arquivos deste item

Nome:: CASSIUS-GUIMARAES-BUSEMEYER.pdf
Tamanho:: 1.903Mb
Formato:: PDF

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Gestão da Informação [594]

Mostrar registro simples