Análise de informações das despesas com combustível das entidades públicas municipais do Paraná
Resumo
Resumo: Dentre os muitos dados abertos disponíveis, este trabalho tem como tema o uso e a respectiva análise de informações das despesas com combustível declaradas pelas entidades públicas do estado do Paraná (e.g. Prefeituras e Câmaras). Estima-se despesas de R$ 380 milhões anuais e um milhão de registros de dados ao ano. São aplicadas técnicas estatísticas e de aprendizagem de máquina para identificar transações incomuns. Assim, são apresentadas e utilizadas Lei de Benford, decomposição de série temporal via STL e o algoritmo de detecção de valores discrepantes Robust Random Cut Forest (RRCF), combinando os scores com Borda count. Os resultados obtidos foram estatísticas descritivas e exploratórias de interesse, uso dos resíduos dos métodos aplicados para classificação e encontrar o limiar – threshold – e lista(s) de anomalias para investigação aprofundada (ranking).
Collections
- Data Science & Big Data [107]