Sila Eukaryotic : ferramenta para anotação automática de genes eucariotos
Resumo
Resumo: A marcação e anotação de genomas são processos essenciais e fundamentais presentes na Bioinformática, necessários para a análise de sequências de DNA. Geralmente essas atividades exigem muito tempo de processamento e alto custo computacional, encarecendo o processo nos muitos projetos distintos ao qual estão presentes. Tais atividades consistem basicamente em comparar sequências de DNA com grandes bancos de dados, este contendo entre milhares e milhões de registros. Considerando a necessidade de melhoramento dessas atividades fundamentais nas pesquisas que envolvem a Biologia Molecular, consequentemente a Bioinformática, este trabalho apresenta um programa de computador, chamado Sila Eukariotic, implementado para a anotação automática de sequências de DNA provenientes de organismos eucarióticos, utilizando busca e comparação de similaridades entre sequências de proteínas. O Sila Eukariotic utiliza ferramenta para predição e marcação de genes (GeneMark-ES) em conjunto com uma ferramenta de buscas de sequências de proteínas em banco de dados (RAFTS3), sendo a predição opcional ao usuário, cabendo também a opção pelo banco de dados de comparação a ser utilizado (NR, SwissProt e outros em formato multi-fasta). Os resultados evidenciaram melhoras na anotação de genes eucarióticos com baixíssimo custo e tempo de processamento comparado a outros buscadores disponíveis. O pacote está disponível para download e poderá ser executado em computadores com relativamente poucos recursos de hardware. Palavras-chave: Anotação automática de genomas eucarióticos, Comparação de sequências, Alignment-free. Abstract: The genome annotations are important and essential processes present on Bioinformatics, necessary to analyse DNA's sequences. Usually these activities need a lot of processing time and have high computational costs, making the projects, which are present, remain expensives. These activities consisti, basically, in comparing DNA's sequences against big data banks, that contain between thousands to milions of records. Seeing the need to improve these activities, this work presents a computer's system, called Sila Eukaryotic, implemented to make the automatic annotation for sequences of eukaryotics organisms, using search and comparison of similarity between proteins sequences. Sila Eukaryotics uses a tool for gene prediction (GeneMark-ES) together with a search proteins tool (RAFTS3) at a biological data bank. The prediction is optional, as the data bank to be used (NR, SwissProt e others on fasta file format). The results showed improvements in annotation, quickly and low computational costs. This package is avaliable to download and can be executed in computers with few hardware resources. Key-words: Automated eukaryotic genome annotation, Sequence comparison, Alignmentfree.
Collections
- Dissertações [67]