Mostrar registro simples

dc.contributor.advisorTsunoda, Denise Fukumi, 1972-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Ciências Sociais Aplicadas. Curso de Graduação em Gestão da Informaçãopt_BR
dc.creatorBusemeyer, Cassius Guimarãespt_BR
dc.date.accessioned2024-02-29T15:22:46Z
dc.date.available2024-02-29T15:22:46Z
dc.date.issued2009pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/48147
dc.descriptionOrientador: Denise Fukumu Tsunodapt_BR
dc.descriptionMonografia(Graduação) - Universidade Federal do Paraná,Setor de Ciências Sociais Aplicadas, Curso de Gestão da Informaçãopt_BR
dc.descriptionInclui referênciaspt_BR
dc.description.abstractResumo: Estudo exploratório sobre Mineração de Textos na produção discente universitária. Aplica tarefa de agrupamento nas monografias de Gestão da Informação, da Universidade Federal do Paraná, apresentadas do ano de 2002 a 2008. Contextualiza o problema do overload informacional por meio de prospecções de crescimento de dados e informações digitais. Justifica com este argumento a importância das técnicas apresentadas para redução deste problema. Aponta a necessidade de saber mensurar o valor da informação com a afirmação de que o ciclo da informação pode orientar profissionais da informação nesta atividade. Mostra as relações da Mineração de Textos com outras áreas. Demonstra todo o processo de Mineração de Textos por meio de uma abordagem completa englobando semântica e estatística. Busca software proprietários, livres e open source de Mineração de Textos relacionando 62 software. Reduz este número para 2 software após análise de quesitos como: disponibilidade para download, necessidades prévias limitadoras e funcionamento do software. Aplica as técnicas de Mineração de Textos em uma base com textos completos e em outra base de resumos. Utiliza o software Rapidminer e o módulo WORDSTAT para a tarefa proposta. Compara os resultados gerados pelo software Rapidminer, identificando que o melhor resultado ocorre na base de resumos, na qual a taxa de acerto é de 80% e o agrupamento é feito em 3 grupos. Apresenta resultados do WORDSTAT sem avaliá-lo, devido a falta de medidas de mensuração. Relativiza o processo de Mineração de Textos com o ciclo de vida da informação. Encontra similaridades e possíveis aplicações. Propõe um levantamento de práticas, técnicas e ferramentas com base no modelo criado. Conclui que dos softwares testados o melhor para a prática acadêmica é o Rapidminer. Comenta as dificuldades encontradas no aprendizado e uso dos software e na falta de algoritmos voltados à língua portuguesa. Identifica a incipiência do mercado brasileiro frente a soluções de Mineração de Textos e aponta como uma área de crescimento promissor e passível de atuação para o Gestor da Informação. Sugere como estudos futuros a aplicação das demais tarefas de mineração, o melhoramento de testes de parâmetros para a tarefa de agrupamento, bem como a comparação com outros algoritmos e base textuais.pt_BR
dc.format.extent1 recurso online : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.subjectMineração de dados (Computação)pt_BR
dc.subjectRecuperação da informaçãopt_BR
dc.subjectRecuperação de dados (Computação)pt_BR
dc.subjectAnalise por conglomeradospt_BR
dc.titleMineração de textos : aplicação nas monografias de gestão da informação (2002-2008)pt_BR
dc.typeTCC Graduação Digitalpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples