Mostrar registro simples

dc.contributor.advisorMonteiro, Rose Adele
dc.contributor.authorCovre, Rafael Antonio
dc.contributor.otherSilva, Adriano Barbosa da
dc.contributor.otherUniversidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática
dc.date.accessioned2016-02-25T16:59:28Z
dc.date.available2016-02-25T16:59:28Z
dc.date.issued2013
dc.identifier.urihttp://hdl.handle.net/1884/40772
dc.descriptionOrientadora : Profª. Drª. Rose Adele Monteiro
dc.descriptionCo-orientador : Prof. Dr. Adriano Barbosa da Silva
dc.descriptionDissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 14/05/2013
dc.descriptionInclui referências : f. 79-84
dc.description.abstractResumo: Transcriptoma e o conjunto completo de transcritos de uma célula em uma dada condição fisiológica e/ou de desenvolvimento. Atualmente, ha varias abordagens para se estudar o transcriptoma, tal como a tecnologia de RNA-Seq, a qual e uma metodologia de alta produção (high-throughput), alta resolução e baixo custo. Esta tecnologia e inovadora devido a independência do conhecimento prévio do genoma do organismo em estudo, revela os limites de transcrição e variações na sequencia, detecta níveis de expressão e não demanda uma grande quantidade de amostras de RNA. Uma das analises principais em dados de RNA-Seq e a detecção de genes diferencialmente expressos em diferentes condições experimentais. O presente trabalho descreve Wedring, um pipeline desenvolvido nas linguagens de programação Python e R, além de integrar softwares de bioinformática. O objetivo de Wedring e determinar genes diferencialmente expressos a partir de experimentos de RNA-Seq. Wedring também visa ser facilmente inserido em outros pipelines, possibilitar o desenvolvimento de serviços web para analise de RNA-Seq e prover meios para facilitar a visualização dos dados para os usuários. Wedring usa o software Bowtie para mapear leituras curtas em genomas. Bowtie e eficiente em termos de uso de memoria e tempo de execução. Wedring também usa o software mapeador TopHat, o qual e baseado no Bowtie e é mais adequado para a analise de genomas eucarióticos. Outros softwares utilizados por Wedring são SAMtools e BEDTools, que sao utilizados para manipular arquivos de mapeamento no formato SAM/BAM. O ultimo software utilizado por Wedring e o DESeq, uma biblioteca de R do projeto Bioconductor. DESeq visa aplicar estatisticas sobre contagens para se inferir genes diferencialmente expressos dado um numero de condições experimentais. Os dados de entrada para o Wedring são o genoma de referencia, o arquivo de características genômicas no formato GFF, as bibliotecas e as condições experimentais. Dados de RNA-Seq de Azospirillum brasilense fp2, uma bactéria fixadora de nitrogênio, foram utilizados para se testar o Wedring. Um total de duas bibliotecas controle e três de tratamento (condição de fixação de A. brasilense fp2), sequenciadas utilizando-se a tecnologia SOLiD foram utilizadas. Ao final da analise 95 genes foram indicados como diferencialmente expressos. Uma analise de qualidade das bibliotecas foi feita e os parâmetros de Wedring foram redefinidos para remover 20 bases da extremidade 3' das leituras. Essa mudança fez com que Bowtie se tornasse mais seletivo para reportar mapeamentos validos, resultando em 141 genes diferencialmente expressos (67 sobreexpressos e 74 subexpressos). A analise de A. brasilense fp2 com o Wedring foi realizada utilizando-se uma única linha de comando, facilitando o processo de analise de expressão genica em experimentos de RNA-Seq. Palavras-chave: Wedring, RNA-Seq. Expressão genica diferencial. Azospirillum brasilense fp2. Fixação biológica de nitrogênio.
dc.description.abstractAbstract: Transcriptome refers to the complete set of the RNA transcripts for a specific cellular developmental/physiological condition. Currently, there are several approaches to study the transcriptome, such as the sequence-based ones, like RNA-Seq technology. RNA-Seq is a recent high-throughput, high resolution and low cost methodology. This technique is innovative due to its independence of previous knowledge about the genome of the target organism. It reveals transcription boundaries, sequence variations, detects expression levels and doesn't require large amounts of RNA samples. One of the main analysis using RNA-Seq data is the detection of differentially expressed genes across different experimental conditions. The current work describes Wedring, a pipeline developed using Python and R programming languages and bioinformatical softwares, whose objective is the achievement of differentially expressed genes lists derived from RNA-Seq experiments. It also aims to be easily embedded in other pipelines due to its modular nature, enable the development of web-services for RNA-Seq analysis and provide users with an easy vizualization of data. Wedring pipeline uses the Bowtie aligner to map short reads to genomes, this software is efficient in terms of memory footprint and execution time. Bowtie indexes genomes using the Burrows-Wheeler Transformation to achieve fast searches in the genome using low amounts of computer memory. Wedring also uses the TopHat mapper (which has Bowtie as its base). Because TopHat is designed to discover splicing junctions, it is more suitable to analyze eukaryotic genomes than Bowtie alone. Other tools used by Wedring are SAMtools and BEDTools, which are softwares used to manipulate mapping files in SAM/BAM formats. The last software used by Wedring is the DESeq, an R library from the Bioconductor project. DESeq aims to apply statistics based on the Negative Binomial Distribution over a count dataset to discover which genes are differentially expressed given a number of experimental conditions. Wedring's inputs are the reference genome, the genomic features file in GFF format, the sequenced libraries and the experimental conditions. RNA-Seq data of Azospirillum brasilense fp2, a nitrogen fixing bacteria, was used as a study case to test Wedring. A total of five libraries, two controls and three treatments, sequenced with SOLiD were used, where the treatments refer to the fixing condition of A. brasilense fp2. At the end of the analysis 95 genes were differentially expressed. A quality analysis of the libraries was performed and Wedring's parameters were reset to trim 20 bases from the reads 3' end. With this change Bowtie could be more selective to report a valid mapping, resulting in 141 differentially expressed genes (67 upregulated, 74 downregulated). The analysis of A. brasilense fp2 with Wedring was performed using a single command line, easing the process of analyzing gene expression in RNA-Seq experiments. Key-words: Wedring. RNA-Seq. Differential Gene Expression. Azospirillum brasilense fp2. Biological Nitrogen Fixation.
dc.format.extent88 f. : il. algumas color., tabs., grafs.
dc.format.mimetypeapplication/pdf
dc.languagePortuguês
dc.relationDisponível em formato digital
dc.subjectGenomas
dc.subjectBioinformática
dc.subjectExpressão gênica
dc.titleWedring : pipeline para análise de expressão diferencial em experimento de RNA-Seq
dc.typeDissertação


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples