Comparação de modelos e estratégias de aprendizado de máquina para previsibilidade de formação do entupimento no processo de produção de gás de síntese usando reforma a seco
Visualizar/Abrir
Data
2024Autor
Tamanho, Guilherme Afonso Gregorini
Metadata
Mostrar registro completoResumo
Resumo : O presente estudo investiga a aplicação de aprendizado de máquina (AM) na previsão de entupimentos em reatores de reforma a seco (RS) utilizados na produção de gás de síntese. A pesquisa foi conduzida no Laboratório de Materiais e Energias Renováveis (LABMATER) da UFPR, com o objetivo principal de comparar modelos preditivos, como Random Forest (RF), Support Vector Classifier (SVC) e K-Nearest Neighbors (K-NN). A meta foi identificar o modelo mais eficaz para prever entupimentos, buscando otimizar o controle operacional e melhorar a estabilidade e a eficiência do processo. Foram empregadas bases de dados reais, abrangendo medições realizadas em dez reações do reator piloto. Duas estratégias de particionamento foram adotadas: a primeira organizou todas as reações em uma base unificada, dividida em conjuntos de treino e teste utilizando separação estratificada; a segunda avaliou reações individuais como bases de teste separadas, representando cenários inéditos para os modelos. A normalização linear dos dados foi realizada, e para a validação dos modelos utilizou-se validação cruzada com o otimizador de hiperparâmetros. Os modelos foram avaliados com base em métricas como revocação, precisão e acurácia ponderada, com especial atenção a revocação para o rótulo 1, que identifica a iminência de entupimentos. A priorização do recall visou reduzir a ocorrência de falsos negativos, garantindo maior confiabilidade na aplicação prática. Ferramentas interpretáveis, como Shapley Additive Explanations (SHAP) e Partial Dependence Plot (PDP), foram empregadas para avaliar o impacto das variáveis operacionais sobre as previsões. A análise indicou que variáveis como pressão, umidade e tempo de reação têm forte influência nos resultados, sendo essenciais para a precisão dos modelos. Os resultados mostraram que o uso de ferramentas interpretáveis não apenas aprimora a compreensão do comportamento dos modelos, mas também auxilia na identificação de fatores críticos para o controle do processo. Essas informações permitem ajustes operacionais proativos, reduzindo o risco de interrupções e aumentando a eficiência na produção de gás de síntese. Este estudo fornece uma base robusta para futuras pesquisas, consolidando a relevância do aprendizado de máquina na otimização de processos industriais. Além disso, apresenta estratégias e abordagens para o uso de AM no processo de RS, destacando melhorias realizadas em uma base de dados utilizada para o treinamento de modelos. Abstract : This study investigates the application of machine learning (ML) in predicting fouling in dry reforming (DR) reactors used to produce synthesis gas. The research was conducted at UFPR's Materials and Renewable Energy Laboratory (LABMATER), with the main objective of comparing predictive models such as Random Forest (RF), Support Vector Classifier (SVC) and KNeighbors Classifier (K-NN). The aim was to identify the most effective model for predicting blockages, to optimize operational control and improve the stability and efficiency of the process. Real databases were used, covering measurements taken in ten pilot reactor reactions. Two partitioning strategies were adopted: the first organized all the reactions into a unified base, divided into training and test sets using stratified separation; the second evaluated individual reactions as separate test bases, representing unpublished scenarios for the models. Data normalization was carried out using the MinMaxScaler technique, and model validation included the use of the StratifiedKFold function with cross-validation and hyperparameter optimization by GridSearchCV. The models were evaluated based on metrics such as recall, precision and weighted accuracy, with special attention to the recall of label 1, which identifies imminent blockages. The recall prioritization aimed to reduce the occurrence of false negatives, ensuring greater reliability in practical application. Interpretable tools such as Shapley Additive Explanations (SHAP) and Partial Dependence Plot (PDP) were used to assess the impact of operational variables on predictions. The analysis indicated that variables such as pressure, humidity and reaction time have a strong influence on the results and are essential for the accuracy of the models. The results showed that the use of interpretable tools not only improves the understanding of model behavior, but also helps to identify critical factors for process control. This information allows for proactive operational adjustments, reducing the risk of outages and increasing efficiency in syngas production. This study provides a robust basis for future research, consolidating the relevance of machine learning in the optimization of industrial processes and proposing significant advances for sustainability in the production of renewable hydrogen.