Mineração de textos aplicada à People Analytics : classificação e análise de sentimento em comentários na plataforma Glassdoor
Resumo
Resumo: Este estudo teve como objetivo realizar a aplicação de técnicas de Processamento de Linguagem Natural (NLP) para aprimorar a análise das avaliações dos colaboradores de uma empresa do setor financeiro dentro da plataforma Glassdoor, visando melhorar a tomada de decisão. Por tratar-se de dados desestruturados, a análises manual dessas informações é trabalhosa e suscetível a erros, o que pode comprometer a qualidade das análises. Foram implementados e avaliados dois modelos de processamento: Google Gemini e VADER focando na identificação de padrões de sentimento e tendências nos comentários. A pesquisa compara os resultados obtidos através dos dois modelos destacando vantagens como custos, eficiência e precisão. Os dados foram coletados via web scraping de avaliações de funcionários e ex-funcionários na plataforma de avaliações Glassdoor, contribuindo para o avanço de soluções baseadas em ciência de dados para o setor de Recursos Humanos (RH) nas empresas. Abstract: This study aimed to apply Natural Language Processing (NLP) techniques to enhance the analysis of employee reviews of a financial sector company on the Glassdoor platform, with the goal of improving decisionmaking. Given that these are unstructured data, manual analysis of this information is laborious and prone to errors, which can compromise the quality of analyses based on this information. Two processing models were implemented and evaluated: Google Gemini and VADER, focusing on identifying sentiment patterns and trends in the comments. The research compares the results obtained through both models, highlighting advantages such as cost, efficiency, and accuracy. The data were collected via web scraping from reviews of current and former employees on the Glassdoor platform, contributing to the advancement of data science-based solutions for the Human Resources (HR) sector in companies.
Collections
- Data Science & Big Data [124]