Comparação de métodos de aprendizado de máquina para predição de falhas de localização em robôs móveis
Resumo
Resumo: O presente trabalho compara quatro algoritmos de aprendizado de máquina para a predição de falhas de localização em robôs móveis autônomos. O método AMCL (Adaptive Monte Carlo Localization), amplamente utilizado com sensores LiDAR, pode apresentar falhas em ambientes com obstáculos dinâmicos, zonas com poucas características geométricas ou configurações simétricas. Com a finalidade de identificar qual algoritmo possui melhor desempenho na detecção antecipada dessas falhas, foram comparados os modelos Random Forest, Support Vector Machine (SVM), Multi-Layer Perceptron (MLP) e XGBoost, utilizando o dataset sintético Robot Localization Failure Prediction Dataset, composto por 417.185 amostras rotuladas de 21 experimentos em 7 ambientes simulados no NVIDIA Isaac Sim. A partir dos dados brutos foram extraídas 22 características de leituras LiDAR e da nuvem de partículas do filtro AMCL. Os modelos foram avaliados com múltiplas métricas e validação cruzada estratificada com 5 folds. Os resultados indicam que os modelos baseados em árvores apresentam o melhor desempenho, com destaque para Random Forest (F1-Score de 0,9604) e o XGBoost (F1 de 0,9516), sendo as características de dispersão das partículas as mais discriminativas. A Análise por tipo de ambiente revela que mapas simétricos representam maior desafio para todos os modelos. O código-fonte completo para replicação do experimento é disponibilizado como apêndice Abstract: O presente trabalho compara quatro algoritmos de aprendizado de máquina para a predição de falhas de localização em robôs móveis autônomos. O método AMCL (Adaptive Monte Carlo Localization), amplamente utilizado com sensores LiDAR, pode apresentar falhas em ambientes com obstáculos dinâmicos, zonas com poucas características geométricas ou configurações simétricas. Com a finalidade de identificar qual algoritmo possui melhor desempenho na detecção antecipada dessas falhas, foram comparados os modelos Random Forest, Support Vector Machine (SVM), Multi-Layer Perceptron (MLP) e XGBoost, utilizando o dataset sintético Robot Localization Failure Prediction Dataset, composto por 417.185 amostras rotuladas de 21 experimentos em 7 ambientes simulados no NVIDIA Isaac Sim. A partir dos dados brutos foram extraídas 22 características de leituras LiDAR e da nuvem de partículas do filtro AMCL. Os modelos foram avaliados com múltiplas métricas e validação cruzada estratificada com 5 folds. Os resultados indicam que os modelos baseados em árvores apresentam o melhor desempenho, com destaque para Random Forest (F1-Score de 0,9604) e o XGBoost (F1 de 0,9516), sendo as características de dispersão das partículas as mais discriminativas. A Análise por tipo de ambiente revela que mapas simétricos representam maior desafio para todos os modelos. O código-fonte completo para replicação do experimento é disponibilizado como apêndice.