Proposta de utilização do IGWO para o problema de classificação de dados desbalanceados por meio do modelo de aprendizado de máquina KELM
Resumo
Resumo: O presente estudo contribui na resolucao do problema de dados desbalanceados, onde o desequilibrio na distribuicao das classes pode prejudicar a precisao da classificacao. Propos-se abordagens de aprendizado de maquina com o intuito de adaptar modelos matematicos de forma a capturar padroes nas caracteristicas relevantes da classe minoritaria, visando melhorias significativas no desempenho geral da classificacao. Os experimentos computacionais do algoritmo IGWO-KELM demonstraram que o modelo foi eficaz, rapido e robusto em diversos cenarios, alcancando altas taxas de AUC em conjuntos de dados desbalanceados. Comparado com outros classificadores como o Naive Bayes, Nearest Neighbors e Incremental Gene Expression Programming Classifier o IGWO-KELM apresentou vantagem em cerca de 76% dos casos avaliados, mesmo em bases com taxa de desbalanceamento inferior a 6%. Alem disso, o metodo ainda apresenta oportunidades de melhoria por meio dos estudos de diferentes algoritmos de busca de hiperparametros, tecnicas de reamostragem e outras abordagens complementares. Em conclusao, o IGWO-KELM oferece uma solucao eficiente e confiavel para melhorar o desempenho do classificador em termos de AUC e tempo de processamento em cenarios de dados desbalanceados. Abstract: This study contributes to solving the problem of imbalanced data, where the imbalance in the distribution of classes can impair classification accuracy. Machine learning approaches were proposed to adapt mathematical models to capture patterns in the relevant features of the minority class, aiming for significant improvements in overall classification performance. Computational experiments with the IGWO-KELM algorithm demonstrated that the model was effective, fast, and robust in various scenarios, achieving high AUC rates on imbalanced datasets. Compared to other classifiers such as Naive Bayes, Nearest Neighbors, and Incremental Gene Expression Programming Classifier, IGWO-KELM showed an advantage in approximately 76% of the evaluated cases, even in datasets with an imbalance rate below 6%. Furthermore, the method still presents opportunities for improvement through the study of different hyperparameter search algorithms, resampling techniques, and other complementary approaches. In conclusion, IGWO-KELM offers an efficient and reliable solution to enhance classifier performance in terms of AUC and processing time in imbalanced data scenarios.
Collections
- Dissertações [101]