• Entrar
    Ver item 
    •   Página inicial
    • BIBLIOTECA DIGITAL: Teses & Dissertações
    • 40001016019P6 Programa de Pós-Graduação em Engenharia de Alimentos
    • Dissertações
    • Ver item
    •   Página inicial
    • BIBLIOTECA DIGITAL: Teses & Dissertações
    • 40001016019P6 Programa de Pós-Graduação em Engenharia de Alimentos
    • Dissertações
    • Ver item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Desenvolvimento de um modelo híbrido, integrando COSMO-SAC e machine learning, para previsão da solubilidade

    Thumbnail
    Visualizar/Abrir
    R - D - PAULO VITOR DE LIMA CARVALHO.pdf (3.376Mb)
    Data
    2025
    Autor
    Carvalho, Paulo Vitor de Lima
    Metadata
    Mostrar registro completo
    Resumo
    Resumo: A extração eficiente de compostos bioativos é amplamente valorizada pelas indústrias de alimentos, farmacêutica e de cosméticos por suas diversas propriedades funcionais. Para tal, desafios técnico e ambiental, sobretudo quando se busca alinhar o processo aos princípios da química verde, são encontrados. Nesse contexto, a escolha adequada de solventes é um fator crítico, dado a ampla gama de solventes disponíveis, diferentes interações moleculares, bem como diversos parâmetros de processo, que influenciam na eficiência da seleção. Modelos termodinâmicos preditivos, como o COSMO-SAC (COnductor-like Screening Model for Segmented Activity Coefficients), nos auxiliam na seleção desses solventes. No entanto, ao empregarmos essa ferramenta, algumas limitações são encontradas, como altos desvios quantitativos entre os dados experimentais e preditos, principalmente em sistemas complexos Diante desse cenário, este trabalho teve como objetivo desenvolver e validar um modelo híbrido que integra o COSMO-SAC e machine learning para a predição da solubilidade. . Para isso, inicialmente foi construída uma base de dados de solubilidade experimentais encontrados na literatura, totalizando 1.950 pontos, incluindo 22 solutos, 44 solventes em 60 diferentes temperaturas. Na sequência, o COSMO-SAC foi utilizado para prever a solubilidade dos sistemas encontrados, apresentando desvios significativos nas previsões quantitativas em comparação com os dados experimentais. Para correção desses desvios, um modelo de machine learning baseado em Regressão por Processos Gaussianos (GPR) foi implementado para corrigir essas falhas, a partir do treinamento com dados experimentais. Os resultados obtidos em ambos os modelos foram avaliados por métricas estatísticas de desempenho, coeficiente de determinação (R²), raiz do erro quadrático médio (do inglês Root Mean Square Error, RMSE) e desvio relativo absoluto (Average Absolute Relative Deviation, AARD) médio e por técnicas de interpretabilidade baseadas em valores SHAP (SHapley Additive exPlanations), que permitiram identificar as variáveis mais relevantes para a previsão. Os resultados demonstraram ganhos expressivos, o R² médio evoluiu de 0,75 para 0,99, enquanto as métricas de erro apresentaram reduções médias superiores a 90% RMSE e 60% AARD, confirmando a capacidade do modelo híbrido melhorar substancialmente a acurácia preditiva. Dessa forma, a abordagem proposta representa uma contribuição de métodos preditivos para a seleção de solventes e para o desenvolvimento de processos de separação e extração mais eficientes. Assim, este trabalho contribui com uma ferramenta computacional robusta, replicável e confiável para suporte à previsão de solubilidade e ao planejamento racional de processos
     
    Abstract: The efficient extraction of bioactive compounds is highly valued by the food, pharmaceutical, and cosmetic industries due to their various functional properties. However, technical and environmental challenges arise, especially when aiming to align processes with the principles of green chemistry. In this context, the appropriate selection of solvents is a critical factor, given the wide range of available solvents, distinct molecular interactions, and multiple process parameters that influence extraction efficiency. Predictive thermodynamic models, such as COSMO-SAC (COnductor-like Screening Model for Segmented Activity Coefficients), assist in solvent selection. Nevertheless, when employing this tool, certain limitations are encountered, including large quantitative deviations between experimental and predicted data, particularly in complex systems. Given this scenario, the objective of this work was to develop and validate a hybrid model that integrates COSMO-SAC and machine learning for solubility prediction. To this end, a database of experimental solubility data collected from the literature was built, comprising 1.950 data points, including 22 solutes, 44 solvents, and 60 different temperatures. Subsequently, COSMO-SAC was used to predict the solubility of the systems, showing significant deviations compared to experimental values. To correct these deviations, a machine learning model based on Gaussian Process Regression (GPR) was implemented and trained using experimental data. The performance of both models was evaluated using statistical metrics, such as the coefficient of determination (R²), root mean square error (RMSE), and average absolute relative deviation (AARD), as well as interpretability techniques based on SHAP (SHapley Additive exPlanations) values to identify the most relevant variables for prediction. The results showed remarkable improvements: the average R² increased from 0.75 to 0.99, while RMSE and AARD decreased by more than 90% and 60%, respectively, confirming the hybrid model’s ability to substantially enhance predictive accuracy. Therefore, the proposed approach represents a relevant contribution to improving predictive methods for solvent selection and the development of more efficient separation and extraction processes. This work provides a robust, replicable, and reliable computational tool to support solubility prediction and the rational design of processes
     
    URI
    https://hdl.handle.net/1884/99368
    Collections
    • Dissertações [71]

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV
     

     

    Navegar

    Todo o repositórioComunidades e ColeçõesPor data do documentoAutoresTítulosAssuntosTipoEsta coleçãoPor data do documentoAutoresTítulosAssuntosTipo

    Minha conta

    EntrarCadastro

    Estatística

    Ver as estatísticas de uso

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV