Análise preditiva de vendas no E-commerce Olist : uma abordagem de séries temporais
Visualizar/ Abrir
Data
2025Autor
Steil, Isabela Pereira Martiniano
Metadata
Mostrar registro completoResumo
Resumo: Este estudo apresenta uma análise preditiva detalhada da demanda de vendas dos 10 SKUs mais vendidos no e-commerce do Brasil, utilizando a base de dados disponibilizada pela Olist. O foco principal é identificar a melhor metodologia de previsão para a otimização dos estoques. A abordagem metodológica inclui a comparação entre modelos estatísticos como SARIMA e Holt-Winters, além de técnicas de Machine Learning como Prophet, junto a modelos de referência como Naive e Média Móvel. Um aspecto crucial da pesquisa foi a validação das diferentes granularidades dos dados, analisando frequências Diária, Semanal e Mensal. A eficácia dos modelos foi mensurada por meio do erro médio quadrático (RMSE) e, de forma essencial, pela Proporção de Erro (RMSE / Média de Vendas), uma métrica que visa converter a precisão estatística em risco de negócio. Os achados mostraram que a granularidade Semanal proporcionou o melhor desempenho nas previsões, concluindo que a seleção dinâmica de modelos por SKU é fundamental, com os modelos de referência simples apresentando a maior eficácia na maioria dos produtos investigados Abstract: This paper proposes a rigorous predictive demand analysis for the top 10 highest-volume SKUs in Brazilian e-commerce, utilizing the Brazilian E-commerce Public Dataset by Olist. The core objective is to determine the optimal forecasting methodology for inventory optimization. The methodological analysis involves comparing statistical models (SARIMA and Holt-Winters) and Machine Learning models (Prophet), alongside benchmark models (Naive and Moving Average). A critical research step was validating data granularity, testing Daily, Weekly, and Monthly frequencies. Model performance was assessed using the Root Mean Squared Error (RMSE) and, notably, the Error Proportion (RMSE / Sales Mean), a metric designed to translate statistical accuracy into business risk. Results indicated that the Weekly granularity offered the best predictive performance. The main conclusion advocates for a dynamic, SKU-specific model selection strategy, as simple baseline models proved most effective for the majority of products analyzed