Explorando as dificuldades da aplicação de dados do mundo real na previsão de volume de chuva com dados de radares meteorológicos
Resumo
Resumo: Este artigo descreve o processo de análise de regressões utilizando dados reais e aborda com ênfase os desafios e soluções encontrados ao lidar com observações reais. O estudo utiliza um conjunto de dados coletados por radares meteorológicos no estado do Paraná fornecidos pelo SIMEPAR, com o objetivo de prever o volume de chuva. Foram realizadas análises exploratórias, identificação e tratamento de dados ausentes, remoção de outliers, além do balanceamento dos dados por meio de um algoritmo de undersampling. Em seguida, foramaplicados seis modelos de regressão para estimar o volume de chuva. Os resultados obtidos foram comparados e avaliados utilizando a métrica RMSE (RootMean Squared Error). Abstract: This article describes the process of regression analysis using realworld data and emphasizes the challenges and solutions encountered when dealing with real observations. The study utilizes a dataset collected by meteorological radars in the state of Paraná, provided by SIMEPAR, with the objective of predicting rainfall volume. Exploratory analyses, identification and handling of missing data, outlier removal, and data balancing through an undersampling algorithm, were performed. Subsequently, six regression models were applied to estimate the rainfall volume. The obtained results were compared and evaluated using the RMSE (RootMean Squared Error) metric.
Collections
- Data Science & Big Data [107]