Discovering LncRNA-disease associations as a link prediction problem in Graphs

Silva, Ana Beatriz Oliveira Villela, 1995-

dc.contributor.advisor	Spinosa, Eduardo Jaques, 1974-	pt_BR
dc.contributor.author	Silva, Ana Beatriz Oliveira Villela, 1995-	pt_BR
dc.contributor.other	Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática	pt_BR
dc.date.accessioned	2022-05-26T19:33:24Z
dc.date.available	2022-05-26T19:33:24Z
dc.date.issued	2021	pt_BR
dc.identifier.uri	https://hdl.handle.net/1884/73423
dc.description	Orientador: Eduardo Jaques Spinosa	pt_BR
dc.description	Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 07/07/2021	pt_BR
dc.description	Inclui referências: p. 57-60	pt_BR
dc.description	Área de concentração: Ciência da Computação	pt_BR
dc.description.abstract	Resumo: Os LncRNAs são biomoléculas intermediarias que participam dos mais diversos processos biológicos em humanos, como o controle da expressão genica e a inativação do cromossomo X. Diversas pesquisas tem associado a expressão de lncRNAs a uma ampla gama de doenças, como câncer de mama, leucemia e outras condições. Neste trabalho, foi proposto um método baseado em grafos denominado PANDA. Este método trata a predição de novas associações entre lncRNAs e doenças como um problema de predição de arestas em um grafo. Um grafo heterogêneo que contem as associações já conhecidas entre lncRNAs e doenças e construído, contendo informações adicionais associadas, como níveis de expressão genica e sintomas de doenças. Em seguida, um auto-encoder variacional e utilizado para aprender a gerar uma representação das características das arestas e vértices do grafo, finalmente aplicando um classificador binário para predizer novas arestas potencialmente não descobertas. Os resultados mostram que PANDA atingiu uma AUC-ROC de 0.976, superando métodos do estado da arte para o mesmo problema. Também avaliamos o desempenho da técnica proposta em outros problemas de predição de arestas na bioinformática, como interações entre fármacos ou calculo da similaridade entre espécies. Os resultados mostraram que PANDA pode ser uma abordagem promissora para gerar embeddings e realizar predição de arestas em problemas dentro da bioinformática.	pt_BR
dc.description.abstract	Abstract: LncRNAs are intermediate molecules that participate in the most diverse biological processes in humans, such as gene expression control and X-chromosome inactivation. Numerous researches have associated lncRNAs with a wide range of diseases, such as breast cancer, leukemia, and many other conditions. In this work, we propose a graph-based method named PANDA. This method treats the prediction of new associations between lncRNAs and diseases as a link prediction problem in a graph. We start by building a heterogeneous graph that contains the known associations between lncRNAs and diseases and additional information such as gene expression levels and symptoms of diseases. We then use a Variational Graph Auto-encoder to learn the representation of the nodes' features and edges, finally applying a binary classifier to predict potentially interesting novel edges. The experimental results indicate that PANDA achieved a 0.976 AUC-ROC, surpassing state-of-the-art methods for the same problem. We also evaluated the proposed technique's performance in other link prediction problems in bioinformatics, such as drug-target interactions or calculating the similarity between species. The results showed that PANDA could be a promising approach to generate embeddings and perform link prediction in bioinformatics problems.	pt_BR
dc.format.extent	1 recurso online : PDF.	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language	Inglês	pt_BR
dc.subject	Biomoléculas	pt_BR
dc.subject	Bioinformática	pt_BR
dc.subject	Ciência da Computação	pt_BR
dc.title	Discovering LncRNA-disease associations as a link prediction problem in Graphs	pt_BR
dc.type	Dissertação Digital	pt_BR

Arquivos deste item

Nome:: R - D - ANA BEATRIZ OLIVEIRA ...
Tamanho:: 3.573Mb
Formato:: PDF

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Dissertações [351]

Mostrar registro simples