Mapeando "hypes" : exageros e esperanças na medicina
Resumo
Resumo: A inovação médica é frequentemente acompanhada por ciclos de otimismo e ceticismo, comumente expressos em inglês através do par retórico "hype or hope". Embora ampla mente utilizado como marcador de hesitação científica, esse discurso ainda não havia sido examinado em larga escala. Analisamos 422 artigos indexados no PubMed que continham ambos os termos em seus títulos ou resumos, com o objetivo de mapear alegações médicas contestadas na literatura biomédica. Utilizando uma metodologia híbrida que combinou processamento de linguagem natural, agrupamento hierárquico de embeddings de texto, sumarização dialética baseada em grandes modelos de lin guagem (LLM) e curadoria humana especializada, identificamos 23 tópicos principais abrangendo doenças e tratamentos. A prevalência dos tópicos no corpus do estudo foi então comparada à base de dados geral do PubMed usando análise de enriquecimento hipergeométrico. Os resultados revelaram diferenças marcantes entre os domínios biomédicos. Tópicos relacionados a tratamentos foram mais super-representados do que os relacionados a doenças, com biópsia líquida (enriquecimento de 22×) e terapias com células-tronco (13×) apresentando a maior super-representação; alto enriqueci mento também foi observado para medicina de precisão, inteligência artificial, cannabis e intervenções baseadas no microbioma. Entre as doenças, o autismo apresentou o maior enriquecimento (4,8×), enquanto o câncer foi o contexto mais frequente para o enquadramento "hype or hope". Em vez de resolver se inovações específicas consti tuem "hype" ou progresso genuíno, este estudo mapeia onde promessa e evidência divergem nos domínios biomédicos—demonstrando como a análise computacional de texto pode revelar padrões coletivos de incerteza científica Abstract: Medical innovation is often accompanied by cycles of optimism and skepticism, com monly expressed through the rhetorical pairing "hype or hope". Although widely used as a marker of scientific hesitation, this discourse has not previously been examined at scale. We analyzed 422 PubMed-indexed articles that contained both terms in their titles or abstracts, aiming to map contested medical claims across the biomedical literature. Using a hybrid methodology that combined Natural Language Processing (NLP), hierarchical clustering of text embeddings, Large Language Model (LLM)–based dialectical summarization, and expert human curation, we identified 23 core topics spanning diseases and treatments. The prevalence of topics in the study corpus was then compared with that in the broader PubMed database using hypergeometric en richment analysis. The results revealed marked differences across biomedical domains. Treatment-related topics were more over-represented than disease-related ones, with liquid biopsy (22× enrichment) and stem cell therapies (13×) showing the strongest over-representation; high enrichment was also observed for precision medicine, ar tificial intelligence, cannabis, and microbiome-based interventions. Among diseases, autism showed the highest enrichment (4.8×) while cancer was the most frequent context for "hype or hope" framing. Rather than resolving whether specific innovations constitute hype or genuine progress, this study maps where promise and evidence diverge across biomedical domains—demonstrating how computational text analysis can uncover collective patterns of scientific uncertainty
Collections
- Dissertações [69]