Otimização de processos financeiros com modelos de análise preditiva
Resumo
Resumo: A gestão da inadimplência representa um desafio crítico para a sustentabilidade financeira das empresas, impactando diretamente a liquidez e o fluxo de caixa. Este trabalho propõe a aplicação de técnicas de análise preditiva e aprendizado de máquina para a otimização de processos financeiros, com foco na identificação antecipada de clientes propensos ao não pagamento. Utilizando a base de dados "Default of Credit Card Clients", foram treinados e comparados quatro modelos de classificação: Regressão Logística, Árvore de Decisão, Random Forest e Gradient Boosting. A metodologia incluiu uma análise exploratória rigorosa, engenharia de atributos e otimização de hiperparâmetros via Grid Search. Os resultados demonstraram que o algoritmo Gradient Boosting apresentou o melhor desempenho global, destacando-se nas métricas de Recall e AUC-ROC. Além disso, a etapa de seleção de atributos permitiu reduzir a dimensionalidade do modelo de 28 para apenas 2 variáveis preditoras sem perda de eficácia, comprovando ser possível aliar alta precisão preditiva com eficiência computacional para a mitigação de riscos de crédito Abstract: Default management represents a critical challenge for corporate financial sustainability, directly impacting liquidity and cash flow. This paper proposes the application of predictive analytics and machine learning techniques to optimize financial processes, focusing on the early identification of clients prone to non-payment. Using the "Default of Credit Card Clients" dataset, four classification models were trained and compared: Logistic Regression, Decision Tree, Random Forest, and Gradient Boosting. The methodology included rigorous exploratory analysis, feature engineering, and hyperparameter optimization via Grid Search. Results showed that the Gradient Boosting algorithm achieved the best overall performance, excelling in Recall and ROC-AUC metrics. Furthermore, the feature selection stage allowed for reducing the model’s dimensionality from 28 to just 2 predictive variables without loss of efficacy, proving it is possible to combine high predictive accuracy with computational efficiency for credit risk mitigation