A machine learning model for cloud-to-ground lightning nowcasting
Resumo
Resumo: A previsão de relâmpagos é uma componente crítica da previsão meteorológica, com impacto direto para a defesa civil e na proteção de infraestruturas. Dessa forma, esta dissertação apresenta o desenvolvimento e avaliação de um modelo de AML projetado para prever eventos de relâmpagos NS com alta resolução espacial e temporal. O modelo foca na previsão da localização e do número de ocorrências de relâmpagos para a região sul-sudeste do Brasil para a próxima hora em intervalos de cinco minutos. Os relâmpagos NS são o foco da nossa previsão, pois estes definem o tipo de descargas eléctricas atmosféricas que ocorrem entre a atmosfera e a superfície do planeta e, portanto, mais capazes de afetar a nossa civilização. A região de interesse selecionada deve-se à disponibilidade de dados de relâmpagos na região e as significativas atividades econômicas e humanas na área. Para esta tarefa, nossa proposta é empregar um método de AML para construir um sistema de nowcasting de relâmpagos NS. Nowcasting é uma modalidade de previsão em que as previsões são feitas a curtíssimo prazo, na faixa de algumas horas. O exame dos padrões espaço-temporais de ocorrência de relâmpagos forneceu valiosas informações sobre o comportamento desse evento elétrico e a definição de sua sazonalidade. Verificamos que os relâmpagos estão mais presentes no litoral durante o verão e na região centro-oeste da nossa região de interesse na primavera. Isto permitiu o desenvolvimento de conjuntos de dados curados para o treino do algoritmo de AML. O método de AML baseia-se em colecções de dados que descrevem o problema considerado. Assim, construímos uma base de dados contendo as ocorrências de relâmpagos declaradas por uma RDLR local de 2018 a 2023. Foram testados três algoritmos de AML, sendo eles: LR, GB e RF. O algoritmo GB apresentou o melhor desempenho. As previsões do modelo definem o número de ocorrências de relâmpagos NS para a próxima hora em incrementos de cinco minutos. Assim, não apenas a presença de relâmpagos é prevista, mas também a severidade do evento. Para além disso, a previsão da quantidade de NS ocorridos em intervalos de cinco minutos permite o monitoramento da evolução de uma tempestade. Este trabalho contribui para o avanço da previsão de relâmpagos ao fornecer uma ferramenta de previsão fiável e acionável, oferecendo uma melhoria em relação aos métodos de previsão tradicionais. Os resultados denotam o potencial do modelo para melhorar a proteção de vidas e infraestrutura, estabelecendo um método para previsões de relâmpagos mais confiáveis em contextos operacionais Abstract: Lightning forecasting is a critical component of weather prediction, directly impacting public safety and infrastructure protection. This dissertation presents the development and evaluation of a ML model designed to predict CG lightning events with high spatial and temporal resolution. The model focuses on forecasting the location and number of lightning occurrences for the Brazilian south-southeastern region for the next hour in five minutes increments. CG strikes are the focus of our prediction for these are the type of atmospheric electric discharges that occur between the atmosphere and the planetary surface, thus most capable of affecting our civilization. The selected ROI is due to the availability of lightning data in the region and the significant economic and human activities in the area. For this task, we propose to employ a ML method to build a CG lightning nowcasting system. Nowcasting is a mode of forecast in which predictions are made in the very short term, in the range of a few hours. The examination of the spatiotemporal patterns of lightning occurrences provided valuable insights into the behavior of this electric event and the definition of its seasonality. We verified that lightning is most present on the coast during the summer and on the central-western region of our ROI in the spring. This allowed for the development of curated datasets for training of the ML algorithm. The ML method relies on data collections that describe the problem considered. Hence, we constructed a database containing the lightning occurrences declared by a local LDLN from 2018 to 2023. Three ML algorithms were tested, with those being: LR, GB, and RF. The GB algorithm presented the foremost performance. The model predictions define the number of CG lightning occurrences for the next hour in five minutes increments. Hence, not only the presence of lightning is predicted but also the severity of the event. Furthermore, the prediction of the quantity of CG strikes in five minutes intervals allow for the monitoring of the thunderstorm evolution. This work contributes to the advancement of lightning forecasting by providing a reliable and actionable predictive tool, offering an improvement over traditional forecasting methods. The findings underscore the model’s potential to enhance public safety and disaster preparedness, paving the way for more accurate and timely lightning predictions in various operational contexts
Collections
- Dissertações [253]