Avaliaçao de métricas de paisagem com o preditoras da produção de café arábica
Resumo
Resumo: As métricas de paisagem são formulações matemáticas que quantificam a estrutura da paisagem medindo sua complexidade em termos de composição e configuração. A complexidade da estrutura da paisagem está relacionada com mecanismos e processos ecológicos que afetam direta e indiretamente a biodiversidade e a provisão de serviços ecossistêmicos. O café arábica é um exemplo de cultivo que apresenta dependência de serviços ecossistêmicos, como a polinização e o controle de pragas, para sua produção. Nosso objetivo nesta pesquisa foi verificar se, e quais as métricas de paisagem são boas variáveis preditoras da produção de café arábica. Para isso nós avaliamos dados de cobertura e uso de solo e de produção de 1170 municípios brasileiros produtores de café arábica. Computámos 46 métricas de paisagem, baseadas na cobertura e uso de solo, que foram submetidas a duas etapas de seleção de variáveis (VIF e AIC), gerando um modelo final com apenas 10 métricas. Nós implementamos este modelo em três algoritmos de aprendizagem de máquina: regressão linear, floresta aleatória e m áquina de vetores de suporte. Comparamos o desempenho destes algoritmos através das medidas de R2, MAE e RMSE. Obtivemos que oito das métricas testadas tiveram relação significativa com a produção de café arábica, mas no geral apresentaram um pequeno efeito. Apesar do algoritmo Floresta Aleatória ter performado melhor que os demais, suas medidas de desempenho foram baixas, muito similares a dos demais algoritmos. Portanto, as métricas de paisagem apresentaram baixo poder preditivo em relação a produção de café arábica. Isso evidencia a complexidade de lidar com a predição da produção agrícola que é dependente de diversos fatores interconectados. Todavia não descartamos a importância destas métricas, que podem ser fundamentais na implementação de modelos preditivos mais potentes, que considerem variáveis origens complementares e em algoritmos mais robustos. Abstract: Landscape metrics are mathematical formulations that quantify landscape structure by measuring its complexity in terms of composition and configuration. The complexity of landscape structure is related to ecological mechanisms and processes that directly and indirectly affect biodiversity and the provision of ecosystem services. Arabica coffee is an example of a crop that depends on ecosystem services, such as pollination and pest control, for its production. The aim of our research was to verify whether, and which, landscape metrics are good predictor variables of Arabica coffee production. To achieve this, we evaluated land cover and use data as well as production data from 1,170 Brazilian municipalities that produce Arabica coffee. We computed 46 landscape metrics, based on land cover and use, which were subjected to two stages of variable selection (VIF and AIC), generating a final model with only 10 metrics. We implemented this model in three machine learning algorithms: linear regression, random forest, and support vector machines. We compared the performance of these algorithms using R2, MAE, and RMSE metrics. We found that eight of the metrics tested had a significant relationship with Arabica coffee production, but overall, they had a small effect. Although the Random Forest algorithm performed better than the others, its performance measures were low and very similar to those of the other algorithms. Therefore, landscape metrics showed low predictive power regarding Arabica coffee production. This highlights the complexity of predicting agricultural production, which is dependent on various interconnected factors. Nevertheless, we do not dismiss the importance of these metrics, which may be fundamental in the implementation of more powerful predictive models that consider complementary variables and more robust algorithms.
Collections
- Data Science & Big Data [138]