• Entrar
    Ver item 
    •   Página inicial
    • BIBLIOTECA DIGITAL: Trabalhos de Graduação
    • Engenharia Mecânica
    • Ver item
    •   Página inicial
    • BIBLIOTECA DIGITAL: Trabalhos de Graduação
    • Engenharia Mecânica
    • Ver item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Análise comparativa de modelos de aprendizado de máquina Random Forest e Árvore de Decisão para detecção de falhas em poços de petróleo : um estudo de caso utilizando o Dataset 3W

    Thumbnail
    Visualizar/Abrir
    R G JUAN FERNANDO COSTA DE MATOS.pdf (1.798Mb)
    Data
    2025
    Autor
    Matos, Juan Fernando Costa de
    Metadata
    Mostrar registro completo
    Resumo
    Resumo : A identificação precoce de falhas em poços de petróleo é crucial para a otimização da produção e a mitigação de riscos operacionais e ambientais na indústria de óleo e gás. Este trabalho tem como objetivo desenvolver e comparar um pipeline de aprendizado de máquina, utilizando os algoritmos Árvore de Decisão e Random Forest, para a classificação da anomalia de "perda rápida de produtividade". A metodologia emprega dados reais do dataset 3W, disponibilizado pela Petrobras, utilizando um poço para treinamento (Poço 16) e outro distinto para validação externa (Poço 20). O pipeline de processamento inclui a segmentação dos dados em janelas temporais, a extração de atributos estatísticos e a redução de dimensionalidade com a Análise de Componentes Principais (PCA), configurada para reter 95% da variância dos dados. Adicionalmente, a técnica de oversampling foi aplicada para balancear as classes no conjunto de treinamento. Os resultados da validação interna no Poço 16 mostraram um desempenho perfeito para ambos os modelos. Contudo, na validação externa no Poço 20, o modelo Random Forest demonstrou uma superioridade expressiva, com uma ROC AUC de 0.9432 contra 0.5287 da Árvore de Decisão, indicando uma capacidade de generalização muito maior. Conclui-se que a arquitetura de ensemble do Random Forest é mais robusta e eficaz para a tarefa, mitigando o superajuste observado no modelo de árvore única e representando uma solução mais confiável para a detecção de anomalias em cenários operacionais reais
     
    Abstract : Early fault detection in oil wells is crucial for optimizing production and mitigating operational and environmental risks in the oil and gas industry. This study aims to develop and compare a machine learning pipeline, using the Decision Tree and Random Forest algorithms, for the classification of the "rapid productivity loss" anomaly. The methodology uses real data from the 3W dataset, provided by Petrobras, utilizing one well for training (Well 16) and a distinct one for external validation (Well 20). The processing pipeline includes segmenting data into temporal windows, extracting statistical features, and reducing dimensionality with Principal Component Analysis (PCA), configured to retain 95% of the data's variance. Additionally, an oversampling technique was applied to balance the classes in the training set. The internal validation results on Well 16 showed perfect performance for both models. However, in the external validation on Well 20, the Random Forest model demonstrated expressive superiority, with a ROC AUC of 0.9432 compared to the Decision Tree's 0.5287, indicating a much greater generalization capability. It is concluded that the ensemble architecture of the Random Forest is more robust and effective for the task, mitigating the overfitting observed in the single tree model and representing a more reliable solution for anomaly detection in real operational scenarios
     
    URI
    https://hdl.handle.net/1884/98946
    Collections
    • Engenharia Mecânica [7]

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV
     

     

    Navegar

    Todo o repositórioComunidades e ColeçõesPor data do documentoAutoresTítulosAssuntosTipoEsta coleçãoPor data do documentoAutoresTítulosAssuntosTipo

    Minha conta

    EntrarCadastro

    Estatística

    Ver as estatísticas de uso

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV