• Entrar
    Ver item 
    •   Página inicial
    • BIBLIOTECA DIGITAL: Teses & Dissertações
    • 40001016066P4 Programa de Pós-Graduação em Bioinformática
    • Dissertações
    • Ver item
    •   Página inicial
    • BIBLIOTECA DIGITAL: Teses & Dissertações
    • 40001016066P4 Programa de Pós-Graduação em Bioinformática
    • Dissertações
    • Ver item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Representações vetoriais de proteomas : um estudo de caso com sequências mitocondriais

    Thumbnail
    Visualizar/Abrir
    R - D - CAMILLA REGINATTO DE PIERRI.pdf (1.860Mb)
    Data
    2017
    Autor
    Pierri, Camilla Reginatto de
    Metadata
    Mostrar registro completo
    Resumo
    Resumo: Grande parte dos estudos evolutivos para inferir ancestralidade são conduzidos utilizando apenas alguns genes mitocondriais. Filogenias baseadas em um único gene podem não conter informações suficientes para construir história evolutiva de determinados organismos. Utilizar genomas mitocondriais completos para análises evolutivas fornecem mais informações que a utilização de proteínas individuais, porém, dependendo do número de organismos, gera alto custo computacional. Não existem propostas até o momento referentes a filogenias derivadas de projeções em espaços vetoriais com redução de dimensão que representem o proteoma de organismos. A abordagem proposta neste trabalho, desenvolvida em ambiente MatLab® é inovadora e resolve problemas associados ao custo computacional na execução de filogenias. Utilizando os dados de 6.811 organismos depositados no RefSeq, realizamos inicialmente a clusterização dos dados, utilizando a ferramenta RAFTS3groups. Após tratamento dos dados, propomos uma estratégia de representação vetorial baseada em k-mers espaçados, utilizando janela deslizante com tamanho de 5 aminoácidos com 1 descontinuado. A partir disso, foi gerada uma matriz de co-ocorrência de 400x400 para cada organismo, representando o proteoma mitocondrial. Esta matriz foi disposta em um vetor de 160.000 atributos, o qual é utilizado para gerar representações vetoriais com redução de dimensão de 100, 400 e 800 coordenadas. Essas vetorizações são representadas em árvores filogenéticas e comparada com filogenia de alinhamento. Elaboramos um algoritmo baseado em UPGMA para realizar árvores filogenéticas e analisamos o proteoma mitocondrial dos Jakobidas e dos Homínidios. A estratégia de extração de atributos e representação vetorial do proteoma se mostrou eficiente para evidenciar relações de parentesco, sendo as filogenias vetorizadas correlacionadas com a filogenia de alinhamento. Palavras-chave: Proteoma Mitocondrial, Filogenia, Bioinformática.
     
    Abstract: Much of the evolutionary studies to infer ancestry are conducted using only a few mitochondrial genes. Phylogenies based on a single gene may not contain enough information to construct evolutionary history of certain organisms. Using complete mitochondrial genomes for evolutionary analysis provides more information than the use of individual proteins, however, depending on the number of organisms, it generates a high computational cost. There are no proposals to date regarding phylogenies derived from projections in vector spaces with size reduction that represent the proteome of organisms. The approach proposed in this work, developed in MatLab® environment, is innovative and solves problems associated with computational cost in the execution of phylogenies. Using data from 6,811 organisms deposited in the RefSeq, we initially performed data clustering using the RAFTS3groups tool. After data processing, we propose a vector representation strategy based on spaced k-mers, using sliding window with size of 5 amino acids with 1 discontinued. From this, a co-occurrence matrix of 400x400 was generated for each organism, representing the mitochondrial proteome. This matrix was arranged in a vector of 160,000 attributes, which is used to generate vector representations with size reduction of 100, 400 and 800 coordinates. These vectorizations are represented in phylogenetic trees and compared with phylogeny of alignment. We developed an algorithm based on UPGMA to perform phylogenetic trees and analyzed the mitochondrial proteome of Jakobids and Hominids. The strategy of attribute extraction and vector representation of the proteome proved to be efficient to evidence kinship relations, with the phylogenies vectored correlated with the phylogeny of alignment. Keywords: Mitochondrial Proteome, Phylogeny, Bioinformatics.
     
    URI
    https://hdl.handle.net/1884/48567
    Collections
    • Dissertações [66]

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV
     

     

    Navegar

    Todo o repositórioComunidades e ColeçõesPor data do documentoAutoresTítulosAssuntosTipoEsta coleçãoPor data do documentoAutoresTítulosAssuntosTipo

    Minha conta

    EntrarCadastro

    Estatística

    Ver as estatísticas de uso

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV