Detecção de Inconsistências em Avaliações do Glassdoor : uma análise comparativa de pequenos modelos de linguagem

Berger, Gabriel Figur

dc.contributor.advisor	Oliveira, Luiz Eduardo Soares de, 1971-	pt_BR
dc.contributor.other	Universidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Data	pt_BR
dc.creator	Berger, Gabriel Figur	pt_BR
dc.date.accessioned	2025-11-11T17:30:10Z
dc.date.available	2025-11-11T17:30:10Z
dc.date.issued	2025	pt_BR
dc.identifier.uri	https://hdl.handle.net/1884/99271
dc.description	Orientador: Prof. Dr. Luiz Eduardo Soares de Oliveira	pt_BR
dc.description	Artigo apresentado como Trabalho de Conclusão de Curso	pt_BR
dc.description	Artigo (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science & Big Data	pt_BR
dc.description	Inclui referências	pt_BR
dc.description.abstract	Resumo: A crescente digitalização e a expansão de plataformas de avaliação online, como o Glassdoor, geraram um volume massivo de dados textuais cujo valor para a área de People Analytics é frequentemente comprometido por inconsistências entre a classificação numérica e o sentimento expresso no conteúdo escrito. Diante deste problema, o presente estudo teve como objetivo central avaliar comparativamente o desempenho de Pequenos Modelos de Linguagem (SLMs) de código aberto na tarefa de identificar inconsistências de classificação-sentimento em um corpus bilíngue (português e inglês) de 1.000 avaliações da plataforma Glassdoor. A metodologia envolveu a criação de um gabarito de referência por meio de anotação manual, a operacionalização do construto de inconsistência e a execução de 42 modelos individuais e 12 modelos de ensemble em um cenário de zero-shot learning. Os resultados indicaram que os SLMs não apenas se mostraram viáveis, mas superaram o desempenho de grandes modelos de linguagem (LLMs) proprietários. Para a maximização da detecção (recall), os modelos da família Qwen (qwen2.5:0.5b e qwen3:0.6b) foram os mais eficazes e eficientes. Para um desempenho equilibrado entre detecção e precisão (F1-Score), os modelos stablelm:12b (inglês) e gemma:7b (português), bem como a estratégia de ensemble, demonstraram maior robustez. Conclui-se que SLMs especializados representam uma solução eficiente e de alto desempenho para a detecção de inconsistências em avaliações, com a escolha do modelo ideal dependendo do critério de otimização (recall ou F1-Score) e do contexto linguístico da análise	pt_BR
dc.description.abstract	Abstract: The increasing digitization and expansion of online review platforms, such as Glassdoor, have generated a massive volume of textual data whose value for People Analytics is often compromised by inconsistencies between the numerical rating and the sentiment expressed in the written content. Given this problem, the present study's central objective was to comparatively evaluate the performance of open-source Small Language Models (SLMs) in the task of identifying rating-sentiment inconsistencies in a bilingual corpus (Portuguese and English) of 1,000 Glassdoor reviews. The methodology involved creating a reference key through manual annotation, operationalizing the inconsistency construct, and running 42 individual models and 12 ensemble models in a zero-shot learning scenario. The results indicated that SLMs not only proved to be viable but also surpassed the performance of proprietary Large Language Models (LLMs). For maximizing detection (recall), the Qwen family models (qwen2.5:0.5b and qwen3:0.6b) were the most effective and efficient. For a balanced performance between detection and precision (F1-Score), the stablelm:12b (English) and gemma:7b (Portuguese) models, as well as the ensemble strategy, demonstrated greater robustness. It is concluded that specialized SLMs represent an efficient and high-performing solution for detecting inconsistencies in reviews, with the choice of the ideal model depending on the optimization criterion (recall or F1-Score) and the linguistic context of the analysis	pt_BR
dc.format.extent	1 recurso online : PDF.	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language	Português	pt_BR
dc.subject	Processamento da linguagem natural (Computação)	pt_BR
dc.subject	Sites da web - Avaliação	pt_BR
dc.subject	Emoções	pt_BR
dc.title	Detecção de Inconsistências em Avaliações do Glassdoor : uma análise comparativa de pequenos modelos de linguagem	pt_BR
dc.type	TCC Especialização Digital	pt_BR

Arquivos deste item

Nome:: R - E - GABRIEL FIGUR BERGER.pdf
Tamanho:: 766.8Kb
Formato:: PDF

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Data Science & Big Data [168]

Mostrar registro simples