Modelagem preditiva para inadimplência de crédito

Martins, Andrei Ferreira

dc.contributor	Bonat, Wagner Hugo	pt_BR
dc.contributor.advisor	Sousa, Pedro Henrique Toledo de Oliveira, 1995-	pt_BR
dc.contributor.other	Universidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Data	pt_BR
dc.creator	Martins, Andrei Ferreira	pt_BR
dc.date.accessioned	2026-01-20T17:18:15Z
dc.date.available	2026-01-20T17:18:15Z
dc.date.issued	2026	pt_BR
dc.identifier.uri	https://hdl.handle.net/1884/100395
dc.description	Orientador: Pedro Henrique Toledo de Oliveira Sousa	pt_BR
dc.description	Artigo apresentado como Trabalho de Conclusão de Curso	pt_BR
dc.description	Monografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science e Big Data	pt_BR
dc.description	Inclui referências	pt_BR
dc.description.abstract	Resumo: Embora a expressiva oferta de crédito por meio de cartões promova inclusão financeira, ela também está associada a um aumento do risco de inadimplência, especialmente em bases de dados com forte desbalanceamento entre clientes adimplentes e inadimplentes. Para mitigar esse problema, métodos de aprendizado de máquina supervisionado têm sido amplamente utilizados na análise de risco de crédito. Dentre essas abordagens, destacam-se modelos de classificação capazes de estimar a probabilidade de inadimplência a partir de informações financeiras e comportamentais. Nesse contexto, este trabalho tem como objetivo avaliar o desempenho dos modelos Regressão Logística, SVM (Support Vector Machine), Random Forest e XGBoost (Extreme Gradient Boosting) na identificação de clientes inadimplentes, considerando diferentes cenários de balanceamento da base de dados. Além disso, foi aplicada a técnica SMOTE (synthetic minority oversampling technique) para reduzir a assimetria entre classes, bem como a otimização do threshold por meio da distância euclidiana na curva ROC (Receiver Operating Characteristic). Os resultados obtidos demonstram que o balanceamento contribui significativamente para a melhoria das métricas de desempenho, com destaque para o modelo Random Forest, que apresentou maior robustez, capacidade discriminativa e generalização, configurando-se como uma alternativa eficiente para apoio à tomada de decisão na concessão de crédito	pt_BR
dc.description.abstract	Abstract: Although the widespread availability of credit through credit cards promotes financial inclusion, it is also associated with an increased risk of default, especially in datasets with a strong imbalance between non-defaulting and defaulting customers. To mitigate this issue, supervised machine learning methods have been widely used in credit risk analysis. Among these approaches, classification models capable of estimating the probability of default based on financial and behavioral information stand out. In this context, this study aims to evaluate the performance of Logistic Regression, SVM, Random Forest, and XGBoost models in identifying defaulting customers, considering different data balancing scenarios. In addition, the SMOTE technique was applied to reduce class imbalance, as well as threshold optimization using the euclidean distance on the ROC Curve. The results demonstrate that data balancing significantly improves performance metrics, with the Random Forest model standing out for its greater robustness, discriminative power, and generalization capability, thus representing an efficient alternative to support decision-making in credit granting	pt_BR
dc.format.extent	1 recurso online : PDF.	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language	Português	pt_BR
dc.subject	Aprendizado do computador	pt_BR
dc.subject	Inadimplência (Finanças)	pt_BR
dc.title	Modelagem preditiva para inadimplência de crédito	pt_BR
dc.type	TCC Especialização Digital	pt_BR

Arquivos deste item

Nome:: R - E - ANDREI FERREIRA MARTINS.pdf
Tamanho:: 986.7Kb
Formato:: PDF

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Data Science & Big Data [191]

Mostrar registro simples