<?xml version="1.0" encoding="UTF-8"?>
<feed xmlns="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
<title>Dissertações</title>
<link href="https://hdl.handle.net/1884/39721" rel="alternate"/>
<subtitle/>
<id>https://hdl.handle.net/1884/39721</id>
<updated>2026-04-25T16:45:34Z</updated>
<dc:date>2026-04-25T16:45:34Z</dc:date>
<entry>
<title>Mapeando "hypes" : exageros e esperanças na medicina</title>
<link href="https://hdl.handle.net/1884/101652" rel="alternate"/>
<author>
<name/>
</author>
<id>https://hdl.handle.net/1884/101652</id>
<updated>2026-04-14T15:39:21Z</updated>
<published>2025-01-01T00:00:00Z</published>
<summary type="text">Mapeando "hypes" : exageros e esperanças na medicina
Resumo: A inovação médica é frequentemente acompanhada por ciclos de otimismo e ceticismo, comumente expressos em inglês através do par retórico "hype or hope". Embora ampla mente utilizado como marcador de hesitação científica, esse discurso ainda não havia sido examinado em larga escala. Analisamos 422 artigos indexados no PubMed que continham ambos os termos em seus títulos ou resumos, com o objetivo de mapear alegações médicas contestadas na literatura biomédica. Utilizando uma metodologia híbrida que combinou processamento de linguagem natural, agrupamento hierárquico de embeddings de texto, sumarização dialética baseada em grandes modelos de lin guagem (LLM) e curadoria humana especializada, identificamos 23 tópicos principais abrangendo doenças e tratamentos. A prevalência dos tópicos no corpus do estudo foi então comparada à base de dados geral do PubMed usando análise de enriquecimento hipergeométrico. Os resultados revelaram diferenças marcantes entre os domínios biomédicos. Tópicos relacionados a tratamentos foram mais super-representados do que os relacionados a doenças, com biópsia líquida (enriquecimento de 22×) e terapias com células-tronco (13×) apresentando a maior super-representação; alto enriqueci mento também foi observado para medicina de precisão, inteligência artificial, cannabis e intervenções baseadas no microbioma. Entre as doenças, o autismo apresentou o maior enriquecimento (4,8×), enquanto o câncer foi o contexto mais frequente para o enquadramento "hype or hope". Em vez de resolver se inovações específicas consti tuem "hype" ou progresso genuíno, este estudo mapeia onde promessa e evidência divergem nos domínios biomédicos—demonstrando como a análise computacional de texto pode revelar padrões coletivos de incerteza científica; Abstract: Medical innovation is often accompanied by cycles of optimism and skepticism, com monly expressed through the rhetorical pairing "hype or hope". Although widely used as a marker of scientific hesitation, this discourse has not previously been examined at scale. We analyzed 422 PubMed-indexed articles that contained both terms in their titles or abstracts, aiming to map contested medical claims across the biomedical literature. Using a hybrid methodology that combined Natural Language Processing (NLP), hierarchical clustering of text embeddings, Large Language Model (LLM)–based dialectical summarization, and expert human curation, we identified 23 core topics spanning diseases and treatments. The prevalence of topics in the study corpus was then compared with that in the broader PubMed database using hypergeometric en richment analysis. The results revealed marked differences across biomedical domains. Treatment-related topics were more over-represented than disease-related ones, with liquid biopsy (22× enrichment) and stem cell therapies (13×) showing the strongest over-representation; high enrichment was also observed for precision medicine, ar tificial intelligence, cannabis, and microbiome-based interventions. Among diseases, autism showed the highest enrichment (4.8×) while cancer was the most frequent context for "hype or hope" framing. Rather than resolving whether specific innovations constitute hype or genuine progress, this study maps where promise and evidence diverge across biomedical domains—demonstrating how computational text analysis can uncover collective patterns of scientific uncertainty
Orientador: Prof. Dr. Roberto Tadeu Raittz; Banca: Mauro Antonio Alves Castro (Presidente da Banca), Nelson Alessandretti de Mello Lemos e Gertrudes Aparecida Dandolini; Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educacao Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa : Curitiba, 10/12/2025; Inclui referências; Área de concentração: Bioinformática
</summary>
<dc:date>2025-01-01T00:00:00Z</dc:date>
</entry>
<entry>
<title>Ferramentas de inteligência artificial para aplicação em filogenia e em Grafo de Lattice</title>
<link href="https://hdl.handle.net/1884/98834" rel="alternate"/>
<author>
<name/>
</author>
<id>https://hdl.handle.net/1884/98834</id>
<updated>2025-10-14T16:02:11Z</updated>
<published>2024-01-01T00:00:00Z</published>
<summary type="text">Ferramentas de inteligência artificial para aplicação em filogenia e em Grafo de Lattice
Resumo: Esta dissertação apresenta as ferramentas rSWeeP e R3TO como inovações no campo da bioinformática e otimização de redes. O rSWeeP é uma implementação em R do método SWeeP, desenvolvida para popularizar esta metodologia no campo da bioinformática. Ao utilizar o SWeeP para representar sequências biológicas em vetores de baixa dimensão, o rSWeeP facilita análises rápidas e precisas de grandes volumes de dados genômicos em uma das plataformas mais populares na bioinformática: a linguagem R. O R3TO é introduzido como uma alternativa eficiente aos métodos tradicionais de cálculo de distância, como o algoritmo de Dijkstra, demonstrando superioridade ao lidar com redes de distribuição elétrica em áreas rurais. Esta pesquisa ainda propõe um uso sinérgico das capacidades do rSWeeP e do R3TO, que pode resultar em ganhos significativos de precisão e eficiência. O estudo, portanto, evidencia o potencial de ambas as ferramentas, isoladas e em conjunto, para impulsionar avanços na análise filogenética, ampliando as possibilidades de aplicações na área de bioinformática; Abstract: This dissertation presents the rSWeeP and R3TO tools as innovations in the field of bioinformatics and network optimization. rSWeeP is an R implementation of the SWeeP method, developed to popularize this methodology in the field of bioinformatics. By using SWeeP to represent biological sequences in low-dimensional vectors, rSWeeP facilitates fast and accurate analysis of large volumes of genomic data in one of the most popular platforms in bioinformatics: the R language. R3TO is introduced as an efficient alternative to traditional distance calculation methods, such as Dijkstra's algorithm, demonstrating superiority when dealing with electrical distribution networks in rural areas. This research also proposes a synergistic use of the capabilities of rSWeeP and R3TO, which can result in significant gains in accuracy and efficiency. The study, therefore, highlights the potential of both tools, alone and together, to drive advances in phylogenetic analysis, expanding the possibilities of applications in the field of bioinformatics
Orientador: Prof. Dr. Roberto Raittz; Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa : Curitiba, 14/06/2024; Inclui referências; Área de concentração: Bioinformática
</summary>
<dc:date>2024-01-01T00:00:00Z</dc:date>
</entry>
<entry>
<title>Assinatura molecular de citocinas na doença de alzheimer e associações clínicas nas coortes ROSMAP, Mayo e MSBB</title>
<link href="https://hdl.handle.net/1884/97895" rel="alternate"/>
<author>
<name/>
</author>
<id>https://hdl.handle.net/1884/97895</id>
<updated>2025-08-12T14:22:12Z</updated>
<published>2025-01-01T00:00:00Z</published>
<summary type="text">Assinatura molecular de citocinas na doença de alzheimer e associações clínicas nas coortes ROSMAP, Mayo e MSBB
Resumo: A doença de Alzheimer (DA) é uma doença neurodegenerativa complexa associada à neuroinflamação crônica. Este estudo investigou o perfil de expressão de citocinas em amostras do córtex cerebral de indivíduos idosos com DA, a fim de identificar biomarcadores e compreender melhor a patogênese da doença. Utilizando dados de sequenciamento de RNA de alta profundidade, foram identificados um conjunto de citocinas cuja expressão está significativamente associada a diferentes aspectos do fenótipo da DA, incluindo declínio cognitivo, deposição de placas Aß e emaranhados neurofibrilares. Também foram analisados dados de sequenciamento de núcleo único, o que permitiu a identificação de citocinas sendo expressas em células específicas, como microglia e astrócitos, que contribuem de forma significativa para a resposta inflamatória na DA. Além disso, foi observada uma correlação entre a expressão de algumas citocinas e o risco genético para a doença. Nossos resultados sugerem que a neuroinflamação mediada por citocinas desempenha um papel importante na progressão da DA e que a modulação da resposta imune pode ser uma estratégia promissora para o desenvolvimento de novas terapias; Abstract: Alzheimer’s disease (AD) is a complex neurodegenerative condition associated with chronic neuroinflammation. This study investigated the cytokine gene expression profile in cerebral cortex samples from elderly individuals with AD to identify biomarkers and gain a deeper understanding of disease pathogenesis. Using high-depth RNA sequencing data, we identified a set of cytokines whose expression is significantly associated with different aspects of the AD phenotype, including cognitive decline, Aß plaque deposition, and neurofibrillary tangles. Single-nucleus data analysis enabled the identification of specific cell types, such as microglia and astrocytes, that contribute significantly to the inflammatory response in AD. Furthermore, we observed a strong correlation between the expression of certain cytokines and genetic risk for the disease. Our findings suggest that cytokine-mediated neuroinflammation plays a crucial role in AD progression and that modulating the immune response may be a promising strategy for developing new therapies
Orientadora: Profa. Dra. Katia de Paiva Lopes; Coorientador: Prof. Dr. Dieval Guizelini; Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa : Curitiba, 25/03/2025; Inclui referências; Área de concentração: Bioinformática
</summary>
<dc:date>2025-01-01T00:00:00Z</dc:date>
</entry>
<entry>
<title>Identificação de variantes de splicing alternativo suscetíveis a degradação pela via NMD por uma abordagem de bioinformática</title>
<link href="https://hdl.handle.net/1884/97506" rel="alternate"/>
<author>
<name/>
</author>
<id>https://hdl.handle.net/1884/97506</id>
<updated>2025-07-29T16:07:41Z</updated>
<published>2020-01-01T00:00:00Z</published>
<summary type="text">Identificação de variantes de splicing alternativo suscetíveis a degradação pela via NMD por uma abordagem de bioinformática
Resumo: A estatística mais recente do GENCODE para a espécie humana, identificou 19.965 genes codificadores de proteína e um número de transcritos oriundos destes genes superior a 83.000. Esse fato está associado principalmente ao processamento do pré-mRNA após a transcrição denominado splicing alternativo. O splicing alternativo do pré-mRNA promove a formação de diferentes transcritos oriundos do mesmo gene devido ao reconhecimento alternativo de íntrons e éxons. Além disso, esses eventos podem alterar o potencial codificador da variante, como no caso da inserção de PTC (do inglês, Premature Termination Code) que pode levar a degradação da variante pela via de NMD (do inglês, Nonsense Mediated Decay). Em experimentos com ênfase em proteogenômica, é relevante a utilização de bancos de dados personalizados de sequências de proteínas que possuam informações de variantes por splicing alternativo e também do potencial codificador dessas variantes. Com esse objetivo, o nosso grupo de pesquisa desenvolveu o repositório SpliceProt para identificar peptídeos de proteoformas derivadas de variantes por splicing alternativo presentes no repositório RefSeq e dbEST. Entretanto, o repositório Unigene foi descontinuado em junho de 2019. O objetivo deste trabalho foi, então, atualizar o fluxo de construção do SpliceProt para receber dados do projeto Ensembl e além disso, adicionar uma etapa de filtragem para variantes por splicing alternativo que poderiam ser degradados pela via de NMD. Para tal, foram elaborados dois bancos de dados contendo dados de alinhamento e anotação do projeto Ensembl (Homo sapiens GRCh38 – versão 96) utilizando o padrão TSL (do inglês, Transcript Support Level) e tamanho da sequência como parâmetros de confiabilidade. Foi verificado discordâncias quanto o número de variantes em cada base de dados indicando que os dados disponíveis no projeto Ensembl não são correspondentes. Ao avaliar variantes preditas como alvo da via de NMD pelo software NMDClassifier, foi verificado que há variantes que não estão de acordo com a anotação do projeto Ensembl, o que pode refletir a necessidade de reformular como os dados estão anotados. Alguns transcritos já descritos na literatura como alvo da via de NMD foram preditos exclusivamente pelo programa NMDClassifier, outros, anotados exclusivamente pelo projeto Ensembl. Sendo assim, sugerimos utilizar as duas fontes de classificação para definir alvos da via de NMD, com destaque para anotação de transcritos codificadores de proteína com valor de TLS igual a 1. Essa etapa se mostrou de grande relevância devido a presença de variantes que eram potenciais alvo da via de NMD no conjunto de dados após tradução in silico. O parâmetro TSL foi avaliado como compatível com a esta abordagem. Entretanto alguns ajustes necessitam ser feitos para a otimização do repositório SpliceProt. Ainda assim, nossa abordagem permitiu identificar mais de 35.000 proteínas hipotéticas associadas à variantes por splicing alternativo que não estavam classificadas no projeto Ensembl como "codificadoras de proteína". Nosso método pode então ser utilizado para a criação de um banco de proteínas hipotéticas e contribuir com a identificação de peptídeos em abordagens de proteômica.; Abstract: The Last GENCODE statistics for Homo sapiens show that there is more than 19,900 protein-coding gene associated with more than 83,000 transcripts. This difference is associated with the post-transcription pre-mRNA processing, named alternative splicing. The alternative splicing is associated to non-canonical recognition of exons and introns and the formation of different transcripts from a single gene. Moreover, the alternative splicing may be associated to the alteration of coding capacity of the variant. For example, a PTC (Premature Termination Code) can be introduced in the transcript and making it sensitive to NMD (Nonsense Mediated Decay). For many proteogenomics research is very important the utilization of personal protein sequences databases with information about coding potential of splicing variants. In this manner, our research group have developed a repository named SpliceProt. This repository were designed to in silico identification of peptides derived from proteins associated with splicing variants in the RefSeq and dbEST databases. However, the Unigene database was retired at July, 2019. The aim of this project was update the SpliceProt pipeline to receive the Ensembl project data and introduce a step for NMD-target identification. We have created two databases, one with alignment information and other with annotation information available at Ensembl project (Homo sapiens GRCh – version 96). The TSL (Transcript Support Level) and the transcript sequence length was used to select all the trustworthy coordinates. We found some discordances about the number of variants in each database, indicating that the data available in the Ensembl project are not corresponding. When we evaluate variants predicted as a NMD-target by the NMDClassifier software, it was found that some variants are not in accordance with the annotation of the Ensembl project. This may reflect the necessity of reformulate how this data is annotated. Some transcripts that have been already described in the literature as NMD-target were predicted exclusively by the NMDClassifier. On the other way, some validated transcripts are exclusively annotated as NMD-target by Ensembl project. Therefore, we suggest using the two classification sources to define NMD-targets, with emphasis on the Ensembl annotation of protein coding transcripts with a TLS value 1. This step proved to be very relevat due to the presence of potential NMD-target variants in the data set after in silico translation. The TSL parameter was evaluated as compatible with this approach. However, we have to perform some adjustments to optimize the SpliceProt repository. Our approach was able to identify more than 35,000 hypothetical proteins associated with alternative splicing variants that were not classified in the Ensembl project as "protein-coding". Our method can be used to create a hypothetical protein database and contribute to peptides identification in proteomic research.
Orientador: Dr. Fabio Passetti; Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa : Curitiba, 20/02/2020; Inclui referências: p. 72-74
</summary>
<dc:date>2020-01-01T00:00:00Z</dc:date>
</entry>
</feed>
