Mostrar registro simples

dc.contributor.advisorAlmeida, Paulo Ricardo Lisboa de, 1989-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Datapt_BR
dc.creatorMiecznikowski, Fabiopt_BR
dc.date.accessioned2024-10-22T20:12:16Z
dc.date.available2024-10-22T20:12:16Z
dc.date.issued2024pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/90353
dc.descriptionOrientador: Prof. Paulo R. Lisboa de Almeidapt_BR
dc.descriptionMonografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science e Big Datapt_BR
dc.descriptionInclui referênciaspt_BR
dc.description.abstractResumo: Este artigo analisa o desempenho de algoritmos de detecção de concept drift emfluxos de dados utilizando a árvore de Hoeffding e compara com a aplicação desse classificador sem nenhum gatilho. Foram aplicadas as técnicas ADWIN, KSWIN, DummyDriftDetector, PageHinkley, HDDM_W, HDDM_A, EDDM e a árvore de Hoeffding sem nenhum gatilho em oito conjuntos de dados reais: Forest Covertype, Electricity, Poker-Hand, Airlines, HTTP, KeyStroke, Phishing, ImageSegments. A avaliação focou em métricas de tempo de execução, uso da CPU, uso da memória e acurácia, com auxílio das seguintes bibliotecas Python: scikit-multiflow, psutil e time. Os resultados indicam que a aplicação da configuração padrão dos gatilhos nem sempre irá superar acurácia do classificador em questão, mas que é possível obter ganhos em acurácia e uso de memória(MB). Observou-se que é possível ter ganhos de acurácia, tanto ao custo de mais tempo de processamento como de menos tempo. Também, é possível obter ganhos de acurácia com menos consumo de memória.pt_BR
dc.description.abstractAbstract: This article analyzes the performance of concept drift detection algorithms in data streams using the Hoeffding’s tree and compares it with the application of this classifier without any trigger. The techniques ADWIN, KSWIN, DummyDriftDetector, PageHinkley, HDDM_W, HDDM_A, EDDM, and the Hoeffding’s tree without any trigger were applied to eight real datasets: Forest Covertype, Electricity, Poker-Hand, Airlines, HTTP, KeyStroke, Phishing, ImageSegments. The evaluation focused on metrics of execution time, CPU usage, memory usage, and accuracy, with the help of the following Python libraries: scikit-multiflow, psutil, and time. The results indicate that applying the default trigger configurations will not always surpass the accuracy of the classifier in question, but it is possible to achieve improvements in both accuracy and memory usage (MB). It was observed that accuracy gains can be achieved either at the cost of more processing time or with less time. Additionally, accuracy improvements can be obtained with lowermemory consumption.pt_BR
dc.format.extent1 recurso online : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectAlgorítmos de computadorpt_BR
dc.subjectFluxo de dados (Computação)pt_BR
dc.titleAvaliação do custo computacional de algoritmos de detecção de desvio de conceitopt_BR
dc.typeTCC Especialização Digitalpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples