Reconhecimento de doenças em plantações com Machine Learning e sistemas embarcados
Resumo
Resumo: Algodão é a fibra natural mais popular no mundo, tendo uma produção mundial em torno de 25 milhões de toneladas todos os anos. O rápido e correto diagnóstico de doenças em plantações é essencial para evitar a propagação de muitas mazelas, o que pode causar perdas na produção e consequentemente perdas financeiras. Para minimizar esses problemas e se beneficiando das novas tecnologias, a agricultura de precisão surgiu por volta dos anos 2000 para otimizar o trabalho em fazendas através da análise de dados de sensores. Hoje em dia, com os avanços tecnológicos de sensores, recursos computacionais e o desenvolvimento de uma base de doenças em plantas confiável, é possível usar algoritmos de Machine Learning (ML) para avaliar as condições das plantações, tornando possível, por exemplo, a captura de imagens e o uso de algoritmos de reconhecimento de padrões para identificar múltiplas anomalias, bem como doenças. Neste contexto, este trabalho apresenta o desenvolvimento de dois modelos de ML capazes de reconhecer doenças em plantações de algodão. Os modelos de classificação desenvolvidos foram migrados nos sistemas embarcados Raspberry Pi modelos 3B+ e 2B, usando as bibliotecas de ML do Python para a implementação dos algoritmos de Multi layer perceptron (MLP) e Random Forest (RF). Os modelos foram treinados e ajustados em um servidor de alto desempenho utilizando com entrada a base de imagens Digipathos, desenvolvida pela Empresa Brasileira de Pesquisa Agropecuária (Embrapa), composta por um conjunto de imagens de diversas doenças em plantações. Os resultados obtidos mostram que, mesmo com recursos limitados de memória e processamento, o Raspberry Pi 3B+ foi capaz de classificar as doenças em folhas de algodão catalogadas com uma acurácia aproximada de 93%, processando a uma taxa de 16,85 Frames por segundo (FPS) para o modelo MLP, e de acurácia de 97% com taxa de 48,65 FPS para o modelo RF. Enquanto que o Raspberry Pi 2B foi capaz de classificar as mesmas doenças com a mesma acurácia, porém com uma taxa de 1,51 FPS para o modelo MLP, e de 6,55 FPS para o modelo RF Abstract: Cotton is the world’s most popular natural fiber, and every year the world produces around 25 million tonnes of cotton. In this way, the prompt and correct diagnosis of crop diseases in plantations is essential to avoid its propagation across the whole plantation, causing financial and production losses. In order to overcome those issues and taking advantage of new technologies, precision agriculture has emerged around the year 2000 and was employed to optimize the work in farms by analyzing data from multiple sensors. Nowadays, with technology advances in sensors, and computing resources, and with the development of reliable plant diseases databases it is possible to use ML applications to evaluate crop conditions, making it possible to capture images in real time and use pattern recognition algorithms to identify anomalies in it, also identifying multiple diseases. In this way, we developed two ML models which is able to recognize diseases in cotton planting. Our classification models were developed to be embedded on the Raspberry Pi boards model 3B+ and 2B, using Python ML libraries to implement MLP and RF algorithms. The models were trained and tested on a high-end server using as input set the Digipathos database, which was built by Brazilian Agricultural Research Corporation (Embrapa) and contains a set of images of different crops diseases. Our results show that, even with the limited memory and processing resources, the Raspberry Pi 3B+ was able to identify the Cotton plant diseases with an accuracy of approximately 93% performing 16.85 FPS when using MLP, and 97% with 48.65 FPS using RF. Meanwhile, the Raspberry Pi 2B presented the same accuracy, but performing 1.51 FPS when using MLP, and 6.55 FPS using RF
Collections
- Data Science & Big Data [138]