Análise de artigos científicos com mineração de texto : uma ferramenta de apoio à revisão de literatura
Resumo
Resumo: O propósito da mineração de texto é extrair informações úteis de um conjunto de dados textuais podendo auxiliar na tomada de decisões. Entender o problema que se quer resolver, definir as estratégias que serão aplicadas como na fases de extração e limpeza dos dados textuais, podem ser consideradas como parte do processo de descobrimento de conhecimento. Nesse contexto, para apoiar a revisão de literatura, desenvolveu-se a aplicação "Caçador de Palavras" com objetivo de processar dados textuais de artigos científicos digitais em formato PDF. O principal produto do processamento dos artigos pela aplicação é a frequência das palavras, obtida utilizando os métodos da linguagem R e os pacotes de biblioteca para Mineração de Texto, realizando a remoção das palavras indesejadas do texto, "lematização", "tokenização", transformando vetor em dataframe e por fim, realizando a contagem das palavras. O conhecimento da frequência das palavras pode auxiliar a decisão na seleção de um artigo na condução de pesquisas científicas.