Redes neurais convolucionais para classificação de peças de mármore
Resumo
Resumo: Este trabalho utiliza redes neurais convolucionais (CNNs) para automatizar a classificação de mármores do tipo Calacatta em uma empresa de extração sediada em Curitiba. O objetivo da pesquisa é aplicar uma rede neural que auxilie o processo manual de classificação de mármores executado pelo diretor e, assim, reduzir tempo, subjetividade e inconsistências. A pesquisa adota um conjunto de 400 imagens, sendo 200 do tipo Calacatta Premium e 200 do tipo Exportação, as quais foram divididas em 80% para treinamento e 20% para teste. Três arquiteturas foram avaliadas (VGG16, ResNet-50 e EfficientNetV2) em 42 experimentos que combinaram técnicas de data augmentation, filtros de escala de cinza e erosão, transfer learning, fine tuning, early stopping e ajustes de hiperparâmetros (learning rate e batch size). A métrica primária foi a acurácia e as secundárias que serviram como apoio analítico foram a precisão, recall e F1-score. A ResNet-50 apresentou o melhor desempenho quando treinada com imagens em escala de cinza, alcançando 79% de acurácia e equilíbrio entre as classes (precisão 78–79%, recall 78–80%). A EfficientNetV2 atingiu a mesma acurácia máxima de 79% com data augmentation, porém exigindo menor tempo de inferência, o que a tornou a opção mais indicada para implementação industrial. Já a VGG16, embora robusta, mostrou acurácia máxima de 77% com imagens erodidas e demandou o maior tempo de processamento. Os ajustes posteriores de learning rate e batch size não superaram os resultados iniciais, sinalizando limitação intrínseca devido ao tamanho restrito da base de dados. Conclui-se que as CNNs podem fornecer decisões de classificação consistentes e objetivas, mas a ampliação do dataset e a adoção de estratégias adicionais de regularização são recomendadas para elevar a acurácia a patamares adequados ao uso em linha de produção. Este estudo reforça o potencial da visão computacional na Indústria 4.0, indicando caminhos para futuras aplicações em processos classificação de mármores Abstract: This study investigates the use of convolutional neural networks (CNNs) to automate the classification of Calacatta marble at an extraction company based in Curitiba. The goal is to develop a neural model that assists the director’s manual classification process, thereby reducing time, subjectivity and inconsistencies. The research uses a dataset of 400 images—200 Calacatta Premium and 200 Calacatta Export—split into 80% for training and 20% for testing. Three architectures (VGG16, ResNet-50, and EfficientNetV2) were evaluated across 42 experiments that combined data-augmentation techniques, grayscale and erosion filters, transfer learning, fine tuning, early stopping and hyperparameter tuning (learning rate and batch size). Accuracy was the primary metric, supported analytically by precision, recall, and F1-score. ResNet-50 showed the best performance when trained on grayscale images, achieving 79% accuracy with balanced class metrics (precision 78–79%, recall 78–80%). EfficientNetV2 reached the same peak accuracy of 79% with data augmentation while requiring less inference time, making it the preferred option for industrial deployment. VGG16, although robust, achieved a maximum accuracy of 77% with eroded images and demanded the longest processing time. Subsequent adjustments to learning rates and batch sizes did not surpass initial results, indicating intrinsic limitations due to the small dataset. The findings suggest that CNNs can deliver consistent, objective classification decisions; however, expanding the dataset and adopting additional regularization strategies are recommended to raise accuracy to production-ready levels. This study reinforces the potential of computer vision within Industry 4.0 and outlines pathways for future applications in marble-classification processes.