Análise da influência dos erros de qualidade dos dados de eventos na mineração de processos de solicitações de empréstimos
Resumo
Resumo: A qualidade dos dados tem se mostrado um fator determinante na análise de processos organizacionais, especialmente em um mundo cada vez mais orientado por dados. Este trabalho investiga como a qualidade dos dados em logs de eventos influencia os resultados da mineração de processos, destacando a importância de dados consistentes para a eficiência e confiabilidade das análises e para a tomada de decisões estratégicas. A mineração de processos, que permite a descoberta, monitoramento e melhoria de processos organizacionais a partir de dados de eventos registrados em sistemas de informação, depende diretamente da qualidade dos dados disponíveis. Neste estudo, utilizou-se uma abordagem experimental com dois registros de eventos: um estruturado, representando dados de alta qualidade, e outro modificado propositalmente com erros, simulando cenários de baixa qualidade. A análise, utilizando ferramentas como o software Disco, avaliou aspectos como o número de variantes, a linearidade dos fluxos e o ritmo de execução das atividades, revelando que a inserção de erros nos dados resultou em maior dispersão de fluxos e aumento do número de variantes, dificultando a análise e a identificação de padrões consistentes. Conclui-se, portanto, que a qualidade dos dados é essencial para o sucesso da mineração de processos Abstract: The quality of data has proven to be a determining factor in the analysis of organizational processes, especially in an increasingly data-driven world. This study investigates how the quality of event log data influences process mining outcomes, highlighting the importance of consistent data for the efficiency and reliability of analyses and strategic decision-making. Process mining, which enables the discovery, monitoring, and improvement of organizational processes based on event data recorded in information systems, directly depends on the quality of available data. In this study, an experimental approach was adopted using two event logs: one structured, representing high-quality data, and another intentionally modified with typical errors, simulating low-quality scenarios. The analysis, conducted with tools such as the Disco software, assessed aspects like the number of variants, flow linearity, and activity execution pace. The results revealed that introducing errors into the data led to greater flow dispersion and an increase in the number of variants, complicating analysis and the identification of consistent patterns. Therefore, it is concluded that data quality is essential for the success of process mining