Show simple item record

dc.contributor.advisorSpinosa, Eduardo Jaques, 1974-pt_BR
dc.contributor.authorSilva, Ana Beatriz Oliveira Villela, 1995-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informáticapt_BR
dc.date.accessioned2022-05-26T19:33:24Z
dc.date.available2022-05-26T19:33:24Z
dc.date.issued2021pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/73423
dc.descriptionOrientador: Eduardo Jaques Spinosapt_BR
dc.descriptionDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 07/07/2021pt_BR
dc.descriptionInclui referências: p. 57-60pt_BR
dc.descriptionÁrea de concentração: Ciência da Computaçãopt_BR
dc.description.abstractResumo: Os LncRNAs são biomoléculas intermediarias que participam dos mais diversos processos biológicos em humanos, como o controle da expressão genica e a inativação do cromossomo X. Diversas pesquisas tem associado a expressão de lncRNAs a uma ampla gama de doenças, como câncer de mama, leucemia e outras condições. Neste trabalho, foi proposto um método baseado em grafos denominado PANDA. Este método trata a predição de novas associações entre lncRNAs e doenças como um problema de predição de arestas em um grafo. Um grafo heterogêneo que contem as associações já conhecidas entre lncRNAs e doenças e construído, contendo informações adicionais associadas, como níveis de expressão genica e sintomas de doenças. Em seguida, um auto-encoder variacional e utilizado para aprender a gerar uma representação das características das arestas e vértices do grafo, finalmente aplicando um classificador binário para predizer novas arestas potencialmente não descobertas. Os resultados mostram que PANDA atingiu uma AUC-ROC de 0.976, superando métodos do estado da arte para o mesmo problema. Também avaliamos o desempenho da técnica proposta em outros problemas de predição de arestas na bioinformática, como interações entre fármacos ou calculo da similaridade entre espécies. Os resultados mostraram que PANDA pode ser uma abordagem promissora para gerar embeddings e realizar predição de arestas em problemas dentro da bioinformática.pt_BR
dc.description.abstractAbstract: LncRNAs are intermediate molecules that participate in the most diverse biological processes in humans, such as gene expression control and X-chromosome inactivation. Numerous researches have associated lncRNAs with a wide range of diseases, such as breast cancer, leukemia, and many other conditions. In this work, we propose a graph-based method named PANDA. This method treats the prediction of new associations between lncRNAs and diseases as a link prediction problem in a graph. We start by building a heterogeneous graph that contains the known associations between lncRNAs and diseases and additional information such as gene expression levels and symptoms of diseases. We then use a Variational Graph Auto-encoder to learn the representation of the nodes' features and edges, finally applying a binary classifier to predict potentially interesting novel edges. The experimental results indicate that PANDA achieved a 0.976 AUC-ROC, surpassing state-of-the-art methods for the same problem. We also evaluated the proposed technique's performance in other link prediction problems in bioinformatics, such as drug-target interactions or calculating the similarity between species. The results showed that PANDA could be a promising approach to generate embeddings and perform link prediction in bioinformatics problems.pt_BR
dc.format.extent1 recurso online : PDF.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languageInglêspt_BR
dc.subjectBiomoléculaspt_BR
dc.subjectBioinformáticapt_BR
dc.subjectCiência da Computaçãopt_BR
dc.titleDiscovering LncRNA-disease associations as a link prediction problem in Graphspt_BR
dc.typeDissertação Digitalpt_BR


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record