Applying "Ensemble of Small Models" to Species Distribution Models with limited data
Resumo
Resumo: Os modelos de distribuição de espécies (SDMs) são ferramentas amplamente utilizadas para prever a distribuição potencial de espécies, com diversas aplicações em ecologia. Modelar espécies raras é desafiador devido às suas áreas de distribuição restritas e pequenos conjuntos de dados, que podem levar ao sobreajuste do modelo. A abordagem Ensemble of Small Models (ESMs) surgiu para mitigar essas limitações, utilizando conjuntos de modelos pequenos e demonstrando resultados satisfatórios. Este estudo aplica ESMs para construir SDMs para espécies comuns e raras, usando como modelo de estudo o gênero de roedores neotropicais Coendou, que inclui 16 espécies variando de comuns (>100 localidades) a raras (<30 localidades). Utilizamos variáveis climáticas, topográficas e de cobertura vegetal como preditores e o algoritmo Maxent. Numerosos pequenos modelos (bivariados) foram calibrados e avaliados, formando um conjunto ponderado com base nos índices AUC e Boyce’s, e suas previsões de conjunto avaliadas com o índice Somers’D. Para reduzir a sobrepredição, aplicamos a metodologia MSDM "a posteriori". Os modelos apresentaram bom desempenho (0,76 AUC - 0,63 Boyce’s), especialmente para espécies raras. A metodologia MSDM ajustou a sobrepredição, embora com algumas restrições artificiais à realidade biológica das espécies. A abordagem ESM, com algoritmos como o Maxent e ajustes de sobrepredição com MSDM, permitiu o desenvolvimento de modelos de alto desempenho, melhorando a confiabilidade dos SDMs, especialmente para espécies raras Abstract: Species Distribution Models (SDMs) are widely used tools for predicting the potential distribution of species, with various applications in ecology. Modeling rare species is challenging due to their restricted distribution areas and small datasets, which can lead to model overfitting. The Ensemble of Small Models (ESMs) approach emerged to overcome these limitations by using small model ensembles and demonstrating satisfactory results. This study applies ESMs to construct SDMs for both common and rare species, using the neotropical rodent genus Coendou as a case study, which includes 16 species ranging from common (>100 locations) to rare (<30 locations). We used climatic, topographic, and vegetation cover variables as predictors and the Maxent algorithm. Numerous small (bivariate) models were calibrated and evaluated, forming a weighted ensemble based on AUC and Boyce’s indices, and their ensemble predictions were assessed with the Somers’D index. To reduce overprediction, we applied the MSDM "a posteriori" methodology. The models showed good performance (0.76 AUC - 0.63 Boyce’s), particularly for rare species. The MSDM methodology adjusted for overprediction, though with some artificial constraints on the biological reality of the species. We found that the ESM approach, with algorithms like Maxent and overprediction adjustments with MSDM, enables the development of high-performance models, thereby improving the reliability of SDMs, especially for rare
species
Collections
- Data Science & Big Data [138]