Aplicação da mineração de dados na análise de sinistros de trânsito no transporte rodoviário de cargas no Brasil
Resumo
Resumo: O Brasil está entre os países com maior número de mortes por sinistros de trânsito do mundo. Considerando o cenário das rodovias federais brasileiras, os veículos de carga são o terceiro tipo de veículo mais comum envolvido. Ainda, a pandemia de COVID-19 teve um impacto significativo na mobilidade humana em todo o mundo. Em relação ao estudo deste problema, os bancos de dados de sinistros de trânsito contêm uma série de informações capazes de orientar a tomada de decisão dos gestores para melhorar a segurança no trânsito. Para investigar tais bases, dispõe-se de metodologias como a Knowledge Discovery in Databases (KDD), ou seja, descoberta de conhecimento das bases de dados. A Mineração de Dados (MD), umas das etapas do KDD, pode ser vista como uma técnica para auxiliar nos processos de extração e busca das informações, sendo possível encontrar nos dados armazenados informações úteis que podem não ser perceptíveis em sua forma natural. O objetivo desta tese é testar técnicas de mineração de dados para a análise de dados de sinistros de trânsito, bem como comparar padrões de sinistros encontrados na literatura envolvendo o transporte rodoviário de cargas com os padrões de sinistros ocorridos em rodovias federais do Brasil utilizando ferramentas de mineração de dados, a partir dos dados disponibilizados pela Polícia Rodoviária Federal (PRF), no período de 2017 a 2021 e investigar os possíveis impactos da pandemia de COVID-19 nos sinistros de trânsito, visando contribuir no processo decisório dos gestores de organizações públicas e privadas. Metodologicamente, foi realizada uma comparação de algoritmos de mineração de dados, avaliando o desempenho de cada técnica de mineração e a comparação da literatura com sinistros no Brasil. O estudo revela ser possível extrair fatores que influenciam nos sinistros de trânsito como os fatores humano, da via e do ambiente, corroborando com os resultados encontrados na literatura. Ao comparar os quatro algoritmos, o estudo mostrou que o algoritmo J48 se apresentou como um classificador satisfatório nos testes realizados. Abstract: Brazil is among the countries with the highest number of deaths from traffic accidents in the world. Considering the scenario of Brazilian federal highways, freight vehicles are the third most common type of vehicle involved. Still, the COVID-19 pandemic has had a significant impact on human mobility around the world. Regarding the study of this problem, the databases of traffic accidents contain a series of information capable of guiding the decision making of managers to improve traffic safety. To investigate such databases, there are methodologies such as Knowledge Discovery in Databases (KDD), that is, knowledge discovery of databases. Data Mining (DM), one of the stages of KDD, can be seen as a technique to assist in the processes of extracting and searching for information, making it possible to find useful information in the stored data that may not be perceptible in its natural form. The objective of this thesis is to test data mining techniques for the analysis of traffic claims data, as well as to compare claims patterns found in the literature involving road freight transport with the claims patterns occurred on federal highways in Brazil using tools of data mining, based on data provided by the Federal Highway Police (PRF), from 2017 to 2021 and to investigate the possible impacts of the COVID-19 pandemic on traffic claims, aiming to contribute to the decision-making process of managers of public organizations and private. Methodologically, a comparison of data mining algorithms was performed, evaluating the performance of each mining technique and comparing the literature with claims in Brazil. The study reveals that it is possible to extract factors that influence traffic accidents, such as human, road and environmental factors, corroborating the results found in the literature. When comparing the four algorithms, the study showed that the J48 algorithm presented itself as a satisfactory classifier in the tests performed.
Collections
- Teses [26]