| dc.contributor.advisor | Fontana, Rafaela Mantovani, 1981- | pt_BR |
| dc.contributor.other | Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Curso de Especialização em Inteligência Artificial Aplicada | pt_BR |
| dc.creator | Cruz, Luiz Henrique dos Santos | pt_BR |
| dc.date.accessioned | 2025-11-10T18:39:12Z | |
| dc.date.available | 2025-11-10T18:39:12Z | |
| dc.date.issued | 2025 | pt_BR |
| dc.identifier.uri | https://hdl.handle.net/1884/99239 | |
| dc.description | Orientadora: Profa. Dra. Rafaela Mantovani Fontana | pt_BR |
| dc.description | Memorial de Projetos (especialização) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Curso de Especialização em Inteligência Artificial Aplicada | pt_BR |
| dc.description | Inclui referências | pt_BR |
| dc.description.abstract | Resumo: Este memorial apresenta uma proposta de Retrieval-Augmented Generation (RAG) para otimizar a consulta a acervos jornalísticos digitais, enfrentando o desafio de filtrar conteúdo preciso e contextualmente relevante em grandes volumes de texto. O trabalho detalha o desenvolvimento de um protótipo funcional, construído com tecnologias de código aberto em etapas que incluem raspagem de dados, limpeza, vetorização semântica e geração de respostas com um Grande Modelo de Linguagem (LLM) local. O resultado é uma arquitetura acessível e replicável que aprimora a apuração jornalística. A discussão final aborda as limitações do modelo, especialmente em escalabilidade e na fidelidade do raciocínio causal, um requisito essencial para a integridade da informação no jornalismo | pt_BR |
| dc.description.abstract | Abstract: This abstract presents a proposal for Retrieval-Augmented Generation (RAG) to optimize querying in digital journalistic archives, addressing the challenge of filtering precise and contextually relevant content from large volumes of text. The work details the development of a functional prototype, built with open-source technologies in stages that include data scraping, cleaning, semantic vectorization, and response generation with a local Large Language Model (LLM). The result is an accessible and replicable architecture that enhances journalistic investigation. The final discussion addresses the model's limitations, especially in scalability and the fidelity of causal reasoning, an essential requirement for the integrity of information in journalism | pt_BR |
| dc.format.extent | 1 recurso online : PDF. | pt_BR |
| dc.format.mimetype | application/pdf | pt_BR |
| dc.language | Português | pt_BR |
| dc.subject | Inteligência artificial | pt_BR |
| dc.subject | Acervos digitais | pt_BR |
| dc.subject | Sistemas de recuperação da informação | pt_BR |
| dc.title | Memorial de projetos : proposta de solução de retrieval augmented generation (RAG) para consulta de acervos jornalísticos digitais | pt_BR |
| dc.type | TCC Especialização Digital | pt_BR |