Banco de dados biológico no modelo relacional para mineração de dados em genomas completos de procariotos disponibilizados pelo NCBI GenBank

Guizelini, Dieval

dc.contributor.author	Guizelini, Dieval	pt_BR
dc.contributor.other	Raittz, Roberto Tadeu	pt_BR
dc.contributor.other	Pedrosa, Fábio de Oliveira, 1947-	pt_BR
dc.contributor.other	Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática	pt_BR
dc.date.accessioned	2012-04-09T18:17:57Z
dc.date.available	2012-04-09T18:17:57Z
dc.date.issued	2012-04-09
dc.identifier.uri	http://hdl.handle.net/1884/25297
dc.description.abstract	Resumo: O NCBI GenBank, um dos três principais bancos de dados primários, tem centralizado as informações obtidas pelos processos de sequenciamento de DNA e/ou RNA e as tem distribuído no formato de arquivos textos. Nos servidores de arquivos do GenBank, para o Domínio Bactéria e Domínio Archea, existe um arquivo em formato específico para cada organismo, cromossomo ou plasmídeo completamente sequenciado, com seus genomas e respectivas anotações. Detectou-se a ausência de um modelo de banco de dados para armazenar todas as informações, bem como se observou a necessidade de redistribuir essas informações no formato de banco de dados relacional. Este trabalho propõe um modelo de banco de dados relacional e um conjunto de ferramentas para análise, transposição dos dados no formato texto para o modelo de banco de dados relacional desenvolvido e estratégias de atualização. O modelo foi desenvolvido a partir da análise da especificação do GenBank e da observação das informações de organismos espalhados em mais de 2000 arquivos. Para o desenvolvimento das ferramentas, adotou-se a metodologia da prototipação, padrões de projetos, testes e análises de desempenho. Os resultados obtidos demonstram a possibilidade de armazenar todos os dados nos principais SGBD, com redução significativa da redundância nos dados e obtenção de alto desempenho nas quatro etapas do processo: 1) sincronização dos arquivos de texto em um repositório local a partir do servidor de arquivos do NCBI; 2) análise dos arquivos e interpretação dos campos; 3) carga dos dados analisados no banco de dados e; 4) aderência do modelo desenvolvido com a especificação e desempenho observado nas consultas feitas. Esta dissertação contribui para um novo modelo de organização, acesso e distribuição das informações do NCBI GenBank.	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language	Português	pt_BR
dc.subject	Teses	pt_BR
dc.subject	Banco de dados relacionais	pt_BR
dc.subject	Genomas	pt_BR
dc.subject	Bioinformática	pt_BR
dc.subject	Genetica - Processamento de dados	pt_BR
dc.title	Banco de dados biológico no modelo relacional para mineração de dados em genomas completos de procariotos disponibilizados pelo NCBI GenBank	pt_BR
dc.type	Dissertação	pt_BR

Arquivos deste item

Nome:: dissertacao_revisao_pos_banca_6.pdf
Tamanho:: 1.499Mb
Formato:: PDF

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Dissertações [70]

Mostrar registro simples