Análise comparativa de modelos de Scoring
Resumo
Resumo : Este estudo analisou a eficácia de três métodos distintos de modelagem estatística — regressão logística, XGBoost e Random Forest — em um conjunto real de dados de crédito para determinar qual técnica apresenta o melhor desempenho na previsão de inadimplência. A metodologia aplicada consistiu em uma análise exploratória das variáveis, uma fase de seleção de variáveis, e a subsequente aplicação dos modelos estatísticos. Esta abordagem permitiu uma compreensão profunda tanto do comportamento da base de dados quanto das variáveis que influenciam a inadimplência neste caso. Os resultados indicaram que o modelo XGBoost superou os demais devido à sua capacidade de manejar grandes volumes de dados e sua eficácia em capturar não-linearidades e complexidades do conjunto de dados. Em contraste, a regressão logística, apesar de ser uma técnica mais tradicional, mostrou robustez e relevância, e o modelo Random Forest, embora menos eficiente que os outros modelos, ainda se mostrou competente. Este trabalho não apenas foca na aplicação prática dessas técnicas de modelagem no setor financeiro, mas também sublinha a importância de uma análise rigorosa de dados antes da modelagem. A análise e seleção cuidadosa de variáveis são essenciais para desenvolver modelos de previsão de crédito mais precisos e confiáveis. Embora o XGBoost tenha apresentado a melhor performance geral, os resultados reforçam a validade de múltiplas abordagens dependendo das necessidades específicas e do contexto de aplicação