Continuação de playlists musicais utilizando sistema de recomendação baseado em feedback implícito
Resumo
Resumo: Sistemas de recomendação são ferramentas robustas utilizadas para auxiliar clientes ou usuários a encontrarem itens relevantes para si. Com o advento de plataforma de treaming de músicas, o modo de se consumir músicas em playlist se popularizou, o que gerou um novo desafio de aplicar sistemas de recomendação para a continuação de playlists. O conjunto de dados do desafio Million Playlist Dataset do Spotify foi utilizado neste trabalho para avaliar diferentes implementações de sistemas de recomendação de feedback implícito. Além disso, foi construída uma interface web interativa utilizando o Plotly Dash para teste das recomendações para playlists personalizadas, com possibilidade de exportar a playlist continuada para a conta do Spotify do usuário. Foram testadas bibliotecas Spotlight, Implicit e LightFM, na linguagem Python, e se observou que a biblioteca Implicit gerou bons resultados nos menores tempos de execução. Utilizando a biblioteca Implicit, foram feitos estudos dos hiperparâmetros nas combinações de 5, 10, 100, 200 e 500 fatores, 5, 10, 20 iterações e 0,1 e 1 para o fator de regularização. O objetivo era identificar uma combinação de hiperparâmetros que executasse o mais rápido possível e gerasse boas recomendações. Os melhores resultados foram obtidos com a utilização de 500 fatores, porém a combinação de 200 fatores, 10 iterações e fator de regularização igual a 1 gerou resultados satisfatórios em menor tempo de execução. Como próximos passos, será compilada uma submissão para o desafio do Spotify e poderá ser estudada a aplicação de algoritmo de similaridade entre a playlist customizada e a base de dados para ser possível a utilização de modelo pré-treinado na aplicação, otimizando seu tempo de execução Abstract: Recommendation systems are robust tools used to help customers or users find items relevant to them. With the advent of music streaming platform, the way of consuming music in playlist has become popular, which has created a new challenge of applying recommender systems for the continuation of playlists. The challenge Million Playlist Dataset from Spotify was used in this work to evaluate different implementations of implicit feedback recommender systems. In addition, an interactive web interface was built using Plotly Dash for testing the recommendations for custom playlists, with the possibility of exporting the continued playlist to the user’s Spotify account. Spotlight, Implicit and LightFM libraries were tested in the Python language, and it was observed that the Implicit library generated good results in the shortest runtimes. Using the Implicit library, studies of the hyperparameters were performed on combinations of 5, 10, 100, 200, and 500 factors, 5, 10, 20 iterations, and 0.1 and 1 for the regularization factor. The goal was to identify a combination of hyperparameters that would run as fast as possible and generate good recommendations. The best results were obtained using 500 factors, but the combination of 200 factors, 10 iterations, and a smoothing factor equal to 1 generated satisfactory results in less execution time. As next steps, a submission will be compiled for Spotify’s challenge, and the application of a similarity algorithm between the customized playlist and the database can be studied to be able to use a pre-trained model in the application, optimizing its execution time.
Collections
- Data Science & Big Data [107]