Mostrar registro simples

dc.contributor.advisorAra, Anderson Luizpt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Datapt_BR
dc.creatorCobre, Alexandre de Fátimapt_BR
dc.date.accessioned2023-12-14T19:19:18Z
dc.date.available2023-12-14T19:19:18Z
dc.date.issued2023pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/85640
dc.descriptionOrientador: Prof. Anderson Arapt_BR
dc.descriptionMonografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science e Big Datapt_BR
dc.descriptionInclui referênciaspt_BR
dc.description.abstractResumo: Introdução. C-C receptor quimiocina tipo 5 (CCR-5), é uma proteína encontrada na superfície das células de defesa (linfócitos e macrófagos). A CCR-5 é a estrutura à qual o vírus HIV (vírus da imunodeficiência humana) se liga para invadir a célula hospedeira causando o desenvolvimento da AIDS (síndrome da imunodeficiência adquirida). Neste estudo, foram desenvolvidos modelos de machine learning (ML) baseados em relação estrutura atividade quantitativa (QSAR) para predizer compostos com bioatividade inibitória contra a proteína CCR-5 para o tratamento de HIV.Material e métodos. Umconjunto de dados experimentais não reduntantes de 2929 compostos com valores de bioatividade inibitória (expressa em IC50) contra a proteína CCR-5 foram colectados na base de dados CHEMBL e empregados para desenvolver modelos de ML baseados em QSAR, visando predizer a sua bioatividade. Esses 2929 compostos foram descritos usando Pubchem fungreprint e 32 diferentes algorítmos de ML foramtreinados e testados. A avaliação do desempenho dos modelos foi feita utilizando as métricas R2,MSE, RMSE, MAE e tempo de treinamento. Cada umdos cinco melhores modelos de ML foi aplicado o método SHAP value visando identificar as features (descritores) mais importantes na predição da bioatividade dos compostos contra HIV. Resultados. Os cinco melhores modelos de ML que tiveram melhor desempenho na predição da bioatividade inibitória contra a proteína CCR-5 para o tratamento de HIV foram: Random Forest (RF), Histogram Gradient Boosting (HGBM), LGBM, Bagging e KNN, cujos valores de capaciadde preditiva (R2) variaram entre 82-87%. Conclusão. Neste estudo, foramdesenvolvido cinco modelos de ML (RF, HGBM, LGBM, Bagging e KNN) para predizer a bioatividade inibitória dos compostos contra a proteína CCR-5 para a descoberta de novos fármacos contra HIV. Esses modelos deML podem ser usados como um filtro de seleção de novas moléculas, que podem ser testadas nos experimentos in vitro e in vivo que visam a descoberta de novos fármacos inibidores da proteína CCR-5 para o tratamento potencial de HIVpt_BR
dc.description.abstractAbstract: Introduction. C-C chemokine receptor type 5 (CCR-5) is a protein found on the surface of defense cells (lymphocytes and macrophages). CCR-5 is the structure to which the HIV virus (human immunodeficiency virus) binds to invade the host cell causing the development of AIDS (acquired immunodeficiency syndrome). In this study, machine learning (ML) models based on quantitative structure activity relationship (QSAR) were developed to predict compounds with inhibitory bioactivity against the CCR-5 protein for the treatment of HIV. Material e métodos. A non-redundant experimental dataset of 2929 compounds with inhibitory bioactivity values (expressed in IC50) against the CCR-5 protein were collected from the CHEMBL database and used to develop QSAR-based ML models to predict their bioactivity. These 2929 compounds were described using PubChem fingerprint and 32 different ML algorithms were trained and tested. The evaluation of the performance of theML models was made using the metrics R2, MSE, RMSE, MAE and training time. Each of the five best ML models was applied the SHAP values method to identify the most important features (descriptors) in predicting the bioactivity of compounds against HIV. Results: The five best ML models that had the best performance in predicting the inhibitory bioactivity against the CCR-5 protein for the treatment of HIV were: Random Forest (RF), Histogram based Gradient Boosting (HGBM), LGBM, Bagging and KNN, whose predictive capacity values (R2) ranged between 82-87Results. The five best ML models that had the best performance in predicting the inhibitory bioactivity against the CCR-5 protein for the treatment of HIV were: Random Forest (RF), Histogram based Gradient Boosting (HGBM), LGBM, Bagging and KNN, whose predictive capacity values (R2) ranged between 82-87%. Conclusion. In this study, five ML models (RF, HGBM, LGBM, Bagging and KNN) were developed to predict the inhibitory bioactivity of compounds against the CCR-5 protein for the discovery of new drugs against HIV. These ML models can be used as a selection filter for new molecules, which can be tested in in vitro and in vivo experiments aimed at discovering new CCR-5 protein inhibitor drugs for the potential treatment of HIV.pt_BR
dc.format.extent1 recurso online : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.subjectHIV (Vírus)pt_BR
dc.subjectAprendizado do computadorpt_BR
dc.subjectFármacospt_BR
dc.titleDesenvolvimento de modelos de machine learning baseados em QSAR-3D para predição de novos candidatos a fármacos inibidores da proteina CCR-5, para o tratamento de HIV/AIDSpt_BR
dc.typeTCC Especialização Digitalpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples