Processamento de linguagem natural na classificação dos domínios de experiência
Resumo
Resumo: Utilizando Processamento de Linguagem Natural esse trabalho apresenta a comparação dos modelos Random Forest, Support Vector Machine, Stochastic Gradient Descent, Multi-layer Perceptrone Redes Neurais Artificiais, na classificação de quadrigramas nos quatro domínios da experiência de um turista, a partir dos comentários realizados no site Tripadvisor sobre seis atrativos do Parque Estadual do Jalapão. Os dois melhores desempenhos foram da Rede Neural Artificial com 77% de acurácia, utilizando Tokenizer do Keras e o Stochastic Gradient Descent com 76% de acurácia utilizando TF-IDF (Term Frequency–Inverse Document Frequency).