Modelo para precificação de aluguéis na cidade de Curitiba
Resumo
Resumo: Definir o valor de aluguel de imóveis com precisão e escalabilidade é um desafio para empresas imobiliárias e proprietários. Diante dessa problemática, este artigo teve como objetivo construir um modelo de Machine Learning capaz de precificar aluguéis de imóveis na cidade de Curitiba. Foram coletados anúncios de imobiliárias locais renomadas durante um ano por web scraping. Após limpeza da base, criação e seleção de variáveis, foram testados cinco algoritmos de regressão com validação cruzada temporal. Após ajuste de hiperparâmetros, o Random Forest apresentou o menor erro médio absoluto. Demonstrou-se, assim, que o modelo desenvolvido apresenta potencial para automatizar a precificação, obtendo previsões precisas e rápidas. Contudo, é importante ressaltar que observou-se uma limitação de dados quanto às residências de alto padrão, casos em que o erro médio cresce com o valor real de locação Abstract: Determining property rental prices with both precision and scalability is a challenge for real-estate firms and owners alike. Addressing this issue, the present study set out to build a Machine Learning model capable of pricing residential rentals in the city of Curitiba. Rental listings from well-known local agencies were gathered over one year via web scraping. After cleaning the dataset and engineering and selecting variables, five regression algorithms were evaluated using time-series cross-validation. Once hyperparameters were tuned, the Random Forest algorithm achieved the lowest mean absolute error. The results indicate that the proposed model can automate pricing, delivering accurate and rapid predictions. Nonetheless, data limitations were observed for high-end residences, where the mean prediction error increases with the actual rental price
Collections
- Data Science & Big Data [168]