Melhorando o acesso a informações farmacêuticas contextuais

Ortiz, Henrique Pereira Tesser

dc.contributor.advisor	Bonat, Wagner Hugo, 1985-	pt_BR
dc.contributor.other	Universidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Data	pt_BR
dc.creator	Ortiz, Henrique Pereira Tesser	pt_BR
dc.date.accessioned	2025-10-21T19:00:42Z
dc.date.available	2025-10-21T19:00:42Z
dc.date.issued	2025	pt_BR
dc.identifier.uri	https://hdl.handle.net/1884/98928
dc.description	Orientador: Prof. Wagner Hugo Bonat	pt_BR
dc.description	Artigo apresentado como Trabalho de Conclusão de Curso	pt_BR
dc.description	Artigo (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science & Big Data	pt_BR
dc.description	Inclui referências	pt_BR
dc.description.abstract	Resumo: A complexidade e a extensão das bulas de medicamentos representam uma barreira significativa para a acessibilidade da informação farmacêutica. Para mitigar este problema, este trabalho apresenta o desenvolvimento de um sistema de Retrieval-augmented Generation (RAG) capaz de responder a consultas em linguagem natural. O sistema opera sobre um corpus de 8.479 bulas de medicamentos coletadas da ANVISA, que são processadas e armazenadas em um banco de dados vetorial. A arquitetura RAG utiliza um Large Language Model (LLM) para sintetizar respostas a partir de trechos (chunks) relevantes recuperados de forma semântica. A avaliação da acurácia semântica foi conduzida contra um Golden Standard de 180 perguntas e respostas, e os resultados foram mensurados através da Similaridade de Cossenos. A performance geral do sistema revelou uma similaridade média de 0.63, confirmando sua capacidade de gerar respostas pertinentes. Contudo, a variação da similaridade entre diferentes categorias de perguntas sugere oportunidades de aprimoramento no componente de recuperação e na estratégia de chunking para garantir a consistência e a relevância das respostas, especialmente em tópicos de maior complexidade	pt_BR
dc.description.abstract	Abstract: The complexity and length of drug package inserts pose a significant barrier to the accessibility of pharmaceutical information for the general public. To mitigate this issue, this work presents the development of a Retrieval-Augmented Generation (RAG) system capable of responding to natural language queries. The system operates on a corpus of 8,479 drug package inserts collected from ANVISA, which are processed and stored in a vector database. A Large Language Model (LLM) is utilized to synthesize responses by leveraging relevant text chunks retrieved semantically from this database. The system's semantic accuracy was evaluated against a Golden Standard of 180 questions and answers, with results measured using Cosine Similarity. The overall performance of the system revealed an average similarity of 0.63, confirming its ability to generate pertinent responses. However, the variation in similarity across different question categories suggests opportunities for improvement in the retrieval component and the chunking strategy to enhance the consistency and relevance of responses, particularly for more complex topics	pt_BR
dc.format.extent	1 recurso online : PDF.	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language	Português	pt_BR
dc.subject	Bulas de medicamentos	pt_BR
dc.subject	Acesso à informação	pt_BR
dc.subject	Inteligência artificial	pt_BR
dc.title	Melhorando o acesso a informações farmacêuticas contextuais	pt_BR
dc.type	TCC Especialização Digital	pt_BR

Arquivos deste item

Nome:: R - E - HENRIQUE PEREIRA TESSER ...
Tamanho:: 431.1Kb
Formato:: PDF

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Data Science & Big Data [163]

Mostrar registro simples