Mostrar registro simples

dc.contributor.advisorOliveira, Luiz Eduardo Gomes de, 1995-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Datapt_BR
dc.creatorDella-Justina, Hellen Matheipt_BR
dc.date.accessioned2023-12-27T17:46:09Z
dc.date.available2023-12-27T17:46:09Z
dc.date.issued2023pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/85885
dc.descriptionOrientador: Prof. Dr. Luiz Eduardo Soares de Oliveirapt_BR
dc.descriptionMonografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science e Big Datapt_BR
dc.descriptionInclui referênciaspt_BR
dc.description.abstractResumo: Um conjunto de dados desbalanceado ocorre quando há diferença no número de amostras em diferentes classes. A fase de aprendizagem para a predição do modelo pode ser afetada em caso de dados desbalanceados. Então, neste estudo, foram aplicadas técnicas de oversampling e undesampling para lidar com dados desbalanceados. Os resultados mostraram um melhor desempenho do modelo Random Forest e das técnicas de oversampling para as métricas acurácia e precisão, um melhor desempenho das técnicas de oversampling para a métrica F1 e um melhor desempenho das técnicas de undersampling para as métricas recall e área sob a curva ROCpt_BR
dc.description.abstractAbstract: An imbalanced data occurs when there is a difference between the distribution of classes within a dataset. Machine learning models can be influenced by imbalanced datasets. So, in this study, it was applied the oversampling and undersampling techniques to deal with imbalanced data. The results show a better model performance for Random Forest and oversampling techniques for accuracy and precision metrics, a better oversampling performance for F1 metric, and a better undersampling performance for recall and ROC curve metricspt_BR
dc.format.extent1 recurso online : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectProbabilidades - Processamento de dadospt_BR
dc.titleAvaliação de técnicas de classificação para dados desbalanceadospt_BR
dc.typeTCC Especialização Digitalpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples