Categorização de produtos usando descrições textuais : aplicação da Biblioteca Fasttext
Resumo
Resumo: Este artigo apresenta uma análise do uso do FastText, uma tecnica de Machine Learning, para a categorizaçao de produtos de um e-commerce brasileiro do segmento de moda e esporte, mais especificamente a empresa Netshoes. O objetivo deste trabalho e avaliar a eficacia do FastText quando aplicado a um conjunto de dados privados fornecido pela empresa. Quatro combinacoes de recursos textuais foram testadas durante os treinamentos com a finalidade de achar o melhor conjunto de atributos para criacao do modelo de classificacao. Alem disso, testou-se a eficacia da segmentacão de textos maiores - como descricoes de produtos - onde os treinamentos foram realizados utilizando trechos do texto ao inves do texto completo. Os resultados obtidos indicam que o FastText, quando treinado com recursos relativos ao nome, descricao, marca, peso e dimensões do produto, alcancou o melhor desempenho. A segmentacao da descricao do produto nao mostrou melhorar os resultados, sugerindo que esta tecnica pode não ser a mais adequada para os dados analisados neste estudo.