• Entrar
    Ver item 
    •   Página inicial
    • BIBLIOTECA DIGITAL: Teses & Dissertações
    • 40001016066P4 Programa de Pós-Graduação em Bioinformática
    • Dissertações
    • Ver item
    •   Página inicial
    • BIBLIOTECA DIGITAL: Teses & Dissertações
    • 40001016066P4 Programa de Pós-Graduação em Bioinformática
    • Dissertações
    • Ver item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Banco de dados biológico no modelo relacional para mineração de dados em genomas completos de procariotos disponibilizados pelo NCBI GenBank

    Thumbnail
    Visualizar/Abrir
    dissertacao_revisao_pos_banca_6.pdf (1.499Mb)
    Data
    2012-04-09
    Autor
    Guizelini, Dieval
    Metadata
    Mostrar registro completo
    Resumo
    Resumo: O NCBI GenBank, um dos três principais bancos de dados primários, tem centralizado as informações obtidas pelos processos de sequenciamento de DNA e/ou RNA e as tem distribuído no formato de arquivos textos. Nos servidores de arquivos do GenBank, para o Domínio Bactéria e Domínio Archea, existe um arquivo em formato específico para cada organismo, cromossomo ou plasmídeo completamente sequenciado, com seus genomas e respectivas anotações. Detectou-se a ausência de um modelo de banco de dados para armazenar todas as informações, bem como se observou a necessidade de redistribuir essas informações no formato de banco de dados relacional. Este trabalho propõe um modelo de banco de dados relacional e um conjunto de ferramentas para análise, transposição dos dados no formato texto para o modelo de banco de dados relacional desenvolvido e estratégias de atualização. O modelo foi desenvolvido a partir da análise da especificação do GenBank e da observação das informações de organismos espalhados em mais de 2000 arquivos. Para o desenvolvimento das ferramentas, adotou-se a metodologia da prototipação, padrões de projetos, testes e análises de desempenho. Os resultados obtidos demonstram a possibilidade de armazenar todos os dados nos principais SGBD, com redução significativa da redundância nos dados e obtenção de alto desempenho nas quatro etapas do processo: 1) sincronização dos arquivos de texto em um repositório local a partir do servidor de arquivos do NCBI; 2) análise dos arquivos e interpretação dos campos; 3) carga dos dados analisados no banco de dados e; 4) aderência do modelo desenvolvido com a especificação e desempenho observado nas consultas feitas. Esta dissertação contribui para um novo modelo de organização, acesso e distribuição das informações do NCBI GenBank.
    URI
    http://hdl.handle.net/1884/25297
    Collections
    • Dissertações [66]

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV
     

     

    Navegar

    Todo o repositórioComunidades e ColeçõesPor data do documentoAutoresTítulosAssuntosTipoEsta coleçãoPor data do documentoAutoresTítulosAssuntosTipo

    Minha conta

    EntrarCadastro

    Estatística

    Ver as estatísticas de uso

    DSpace software copyright © 2002-2022  LYRASIS
    Entre em contato | Deixe sua opinião
    Theme by 
    Atmire NV