Mostrar registro simples

dc.contributor.advisorRaittz, Roberto Tadeupt_BR
dc.contributor.authorPierri, Camilla Reginatto dept_BR
dc.contributor.otherCastro, Mauro Antônio Alvespt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformáticapt_BR
dc.date.accessioned2018-07-16T13:34:29Z
dc.date.available2018-07-16T13:34:29Z
dc.date.issued2017pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/48567
dc.descriptionOrientador : Prof. Dr. Roberto Tadeu Raittzpt_BR
dc.descriptionCoorientador : Prof. Dr. Mauro Antônio Alves Castropt_BR
dc.descriptionDissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 15/05/2017pt_BR
dc.descriptionInclui referências : f. 67-77pt_BR
dc.description.abstractResumo: Grande parte dos estudos evolutivos para inferir ancestralidade são conduzidos utilizando apenas alguns genes mitocondriais. Filogenias baseadas em um único gene podem não conter informações suficientes para construir história evolutiva de determinados organismos. Utilizar genomas mitocondriais completos para análises evolutivas fornecem mais informações que a utilização de proteínas individuais, porém, dependendo do número de organismos, gera alto custo computacional. Não existem propostas até o momento referentes a filogenias derivadas de projeções em espaços vetoriais com redução de dimensão que representem o proteoma de organismos. A abordagem proposta neste trabalho, desenvolvida em ambiente MatLab® é inovadora e resolve problemas associados ao custo computacional na execução de filogenias. Utilizando os dados de 6.811 organismos depositados no RefSeq, realizamos inicialmente a clusterização dos dados, utilizando a ferramenta RAFTS3groups. Após tratamento dos dados, propomos uma estratégia de representação vetorial baseada em k-mers espaçados, utilizando janela deslizante com tamanho de 5 aminoácidos com 1 descontinuado. A partir disso, foi gerada uma matriz de co-ocorrência de 400x400 para cada organismo, representando o proteoma mitocondrial. Esta matriz foi disposta em um vetor de 160.000 atributos, o qual é utilizado para gerar representações vetoriais com redução de dimensão de 100, 400 e 800 coordenadas. Essas vetorizações são representadas em árvores filogenéticas e comparada com filogenia de alinhamento. Elaboramos um algoritmo baseado em UPGMA para realizar árvores filogenéticas e analisamos o proteoma mitocondrial dos Jakobidas e dos Homínidios. A estratégia de extração de atributos e representação vetorial do proteoma se mostrou eficiente para evidenciar relações de parentesco, sendo as filogenias vetorizadas correlacionadas com a filogenia de alinhamento. Palavras-chave: Proteoma Mitocondrial, Filogenia, Bioinformática.pt_BR
dc.description.abstractAbstract: Much of the evolutionary studies to infer ancestry are conducted using only a few mitochondrial genes. Phylogenies based on a single gene may not contain enough information to construct evolutionary history of certain organisms. Using complete mitochondrial genomes for evolutionary analysis provides more information than the use of individual proteins, however, depending on the number of organisms, it generates a high computational cost. There are no proposals to date regarding phylogenies derived from projections in vector spaces with size reduction that represent the proteome of organisms. The approach proposed in this work, developed in MatLab® environment, is innovative and solves problems associated with computational cost in the execution of phylogenies. Using data from 6,811 organisms deposited in the RefSeq, we initially performed data clustering using the RAFTS3groups tool. After data processing, we propose a vector representation strategy based on spaced k-mers, using sliding window with size of 5 amino acids with 1 discontinued. From this, a co-occurrence matrix of 400x400 was generated for each organism, representing the mitochondrial proteome. This matrix was arranged in a vector of 160,000 attributes, which is used to generate vector representations with size reduction of 100, 400 and 800 coordinates. These vectorizations are represented in phylogenetic trees and compared with phylogeny of alignment. We developed an algorithm based on UPGMA to perform phylogenetic trees and analyzed the mitochondrial proteome of Jakobids and Hominids. The strategy of attribute extraction and vector representation of the proteome proved to be efficient to evidence kinship relations, with the phylogenies vectored correlated with the phylogeny of alignment. Keywords: Mitochondrial Proteome, Phylogeny, Bioinformatics.pt_BR
dc.format.extent88 f. : il. algumas color.;grafs., tabs.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.relationDisponível em formato digitalpt_BR
dc.subjectFilogeniapt_BR
dc.subjectDNA mitocondrialpt_BR
dc.subjectBioinformáticapt_BR
dc.titleRepresentações vetoriais de proteomas : um estudo de caso com sequências mitocondriaispt_BR
dc.typeDissertaçãopt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples