• Entrar
    Ver item 
    •   Página inicial
    • BIBLIOTECA DIGITAL: Teses & Dissertações
    • 40001016003P2 Programa de Pós-Graduação em Ciências (Bioquímica)
    • Teses
    • Ver item
    •   Página inicial
    • BIBLIOTECA DIGITAL: Teses & Dissertações
    • 40001016003P2 Programa de Pós-Graduação em Ciências (Bioquímica)
    • Teses
    • Ver item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos

    Thumbnail
    Visualizar/Abrir
    R - T - DIEVAL GUIZELINI.pdf (3.289Mb)
    Data
    2016
    Autor
    Guizelini, Dieval
    Metadata
    Mostrar registro completo
    Resumo
    Resumo: O processo de reconstrução completa da sequência de DNA dos genomas bacterianos ainda é complexo. Apenas 13% dos projetos de sequenciamento de genomas procarióticos são concluídos. Versões rascunho da sequência do genoma são depositadas nos bancos de dados públicos, na forma fragmentada de contigs e com prováveis perdas de informações gênicas. Esta tese tem o objetivo de identificar erros de montagem e melhorar o processo de montagem de genomas de bactérias. Padrões biólogos observados em sequências genômicas e a utilização de informação a priori permitem a identificação de regiões com erros de montagem, reorganizar as sequências e melhorar a montagem do genoma. Com a finalidade de melhorar a finalização das montagens, os contigs são quebrados nos pontos de máximo e mínimo local da curva Fuzzy-GC-Skew e armazenados em nós de um grafo sem bordas. Esses nós são ordenados com base na sequência de referência e submetidos para fechamento das lacunas pelo jFGap. No método desenvolvido neste trabalho - G-Finisher -, os contigs são quebrados nos pontos críticos da curva Fuzzy GC Skew, reordenados e as lacunas fechadas com o jFGap. O G-Finisher foi testado nas 96 montagens obtidas pelo GAGE-B e reduziu na média 86% o número de contigs. G-Finisher pode facilmente melhorar os projetos de montagens de genomas de procariotos, de modo que os programas de montagem podem ser melhorados com a incorporação do G-Finisher ou com a utilização de padrões de sequências biológicas. O software e o código-fonte, escrito em Java, foram licenciados na forma do software livre e disponibilizados em http://gfinisher.sourceforge.net/.
     
    Abstract: The process of reconstruction of complete genome from DNA sequences is still complex. Only 13% of the prokaryotic genome sequencing projects are completely finished. Draft genome sequences deposited in public databases are fragmented in contigs and may lack the full gene content. To identify assembly errors and improve the assembly process of bacterial genomes are the purpose of this work. The biological patterns observed in genomic sequences and the application of a priori information allows the identification of misassembled regions, and the reorganization and improvement of the overall genome assembly. In order to improve the finishing of genome assemblies the contigs are broken down at the peaks (all critical points) of a Fuzzy-GC-Skew-Moving-Average graph and stored in computer nodes in a graph data structure without edges. These nodes are ordered following a reference and submitted to the gap closing software jFGap. In the proposed new method - GFinisher - critical peaks in Fuzzy GC skew graphs are broken down, reassembled and closed using jFGap. The number of contigs decreases by up 86%. This has been successfully applied to the 96 genome assemblies described and provide by GAGE-B. GFinisher can easily optimize assemblies of prokaryotic draft genomes and can be used to improve the assembly programs using biological genome sequence patterns. The software was written em Java, licensed in open-source and the binaires and source code are available at http://gfinisher.sourceforge.net/. Keywords: genome finisher, gap close, contig order, genome assembly
     
    URI
    http://hdl.handle.net/1884/44707
    Collections
    • Teses [216]

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV
     

     

    Navegar

    Todo o repositórioComunidades e ColeçõesPor data do documentoAutoresTítulosAssuntosTipoEsta coleçãoPor data do documentoAutoresTítulosAssuntosTipo

    Minha conta

    EntrarCadastro

    Estatística

    Ver as estatísticas de uso

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV