Mostrar registro simples

dc.contributor.advisorValle, Pablo Deivid, 1975-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Tecnologia. Curso de Graduação em Engenharia Mecânicapt_BR
dc.creatorMatos, Juan Fernando Costa dept_BR
dc.date.accessioned2025-10-21T20:59:22Z
dc.date.available2025-10-21T20:59:22Z
dc.date.issued2025pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/98946
dc.descriptionOrientado: Prof. Dr. Pablo Vallept_BR
dc.descriptionMonografia (graduação) - Universidade Federal do Paraná, Setor de Tecnologia, Curso de Graduação em Engenharia Mecânicapt_BR
dc.descriptionInclui referênciaspt_BR
dc.description.abstractResumo : A identificação precoce de falhas em poços de petróleo é crucial para a otimização da produção e a mitigação de riscos operacionais e ambientais na indústria de óleo e gás. Este trabalho tem como objetivo desenvolver e comparar um pipeline de aprendizado de máquina, utilizando os algoritmos Árvore de Decisão e Random Forest, para a classificação da anomalia de "perda rápida de produtividade". A metodologia emprega dados reais do dataset 3W, disponibilizado pela Petrobras, utilizando um poço para treinamento (Poço 16) e outro distinto para validação externa (Poço 20). O pipeline de processamento inclui a segmentação dos dados em janelas temporais, a extração de atributos estatísticos e a redução de dimensionalidade com a Análise de Componentes Principais (PCA), configurada para reter 95% da variância dos dados. Adicionalmente, a técnica de oversampling foi aplicada para balancear as classes no conjunto de treinamento. Os resultados da validação interna no Poço 16 mostraram um desempenho perfeito para ambos os modelos. Contudo, na validação externa no Poço 20, o modelo Random Forest demonstrou uma superioridade expressiva, com uma ROC AUC de 0.9432 contra 0.5287 da Árvore de Decisão, indicando uma capacidade de generalização muito maior. Conclui-se que a arquitetura de ensemble do Random Forest é mais robusta e eficaz para a tarefa, mitigando o superajuste observado no modelo de árvore única e representando uma solução mais confiável para a detecção de anomalias em cenários operacionais reaispt_BR
dc.description.abstractAbstract : Early fault detection in oil wells is crucial for optimizing production and mitigating operational and environmental risks in the oil and gas industry. This study aims to develop and compare a machine learning pipeline, using the Decision Tree and Random Forest algorithms, for the classification of the "rapid productivity loss" anomaly. The methodology uses real data from the 3W dataset, provided by Petrobras, utilizing one well for training (Well 16) and a distinct one for external validation (Well 20). The processing pipeline includes segmenting data into temporal windows, extracting statistical features, and reducing dimensionality with Principal Component Analysis (PCA), configured to retain 95% of the data's variance. Additionally, an oversampling technique was applied to balance the classes in the training set. The internal validation results on Well 16 showed perfect performance for both models. However, in the external validation on Well 20, the Random Forest model demonstrated expressive superiority, with a ROC AUC of 0.9432 compared to the Decision Tree's 0.5287, indicating a much greater generalization capability. It is concluded that the ensemble architecture of the Random Forest is more robust and effective for the task, mitigating the overfitting observed in the single tree model and representing a more reliable solution for anomaly detection in real operational scenariospt_BR
dc.format.extent1 recurso online : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.subjectPoços de petróleopt_BR
dc.subjectArvores de decisãopt_BR
dc.subjectAprendizado do computadorpt_BR
dc.titleAnálise comparativa de modelos de aprendizado de máquina Random Forest e Árvore de Decisão para detecção de falhas em poços de petróleo : um estudo de caso utilizando o Dataset 3Wpt_BR
dc.typeTCC Graduação Digitalpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples