Aplicação de LSTM para previsão do preço do etanol hidratado no Brasil
Resumo
Resumo: A volatilidade do preço do etanol hidratado praticado nos postos de combustíveis do Brasil, aliada à falta de clareza a respeito das variáveis que influenciam nesta variabilidade, resultam no desestímulo do consumo deste biocombustível por parte dos consumidores e no enfraquecimento da indústria nacional de etanol, que possui grande espaço para crescimento. Por este motivo, este artigo objetivou aplicar uma arquitetura de Redes Neurais Recorrentes denominada Long Short-Term Memory (LSTM) para realizar a previsão do preço do etanol hidratado e orientar consumidores e produtores desde combustível. Foram coletadas séries históricas do preço do etanol e de variáveis correlacionadas e a LSTM foi aplicada utilizando dois métodos. Em um deles, somente a série histórica do preço do etanol foi utilizada como variável de entrada e, em outro, as séries de todas as variáveis correlacionadas (bem como a do preço do etanol) foram utilizadas. A partir dos resultados obtidos, observou-se menor erro percentual médio para a LSTM em que foram utilizadas todas as variáveis como entrada, e menores erros absolutos para o método utilizando somente os preços do etanol. Abstract: The volatility of the hydrous ethanol price observed in the gas stations around Brazil, together with the lack of clarity regarding the variables that influence in the variability of these prices, result in the discouragement of this biofuel usage by consumers, as well as in the weakening of ethanol national industry. For this reason, this article aimed to apply a recurrent Neural Network architecture called Long Short-Term Memory (LSTM) to achieve the forecast of hydrous ethanol price and provide guidance to consumers and producers of this fuel. Time series of the hydrous ethanol price, as well as of other correlated variables, were collected and the LSTM was applied using two methods. For the first method, only the ethanol price time series was used as an input variable and, for the second one, the time series of all variables (including the one for ethanol price) were used. Based on the obtained results, we could observe a smaller average percentage error for the method where all the variables were used as input for the LSTM, and smaller absolute errors for the method where only the ethanol price time series was used.
Collections
- Data Science & Big Data [107]