Algoritmo de predição de desempenho de alunos do curso de análise e desenvolvimento de sistemas baseado no histórico acadêmico e dados sociodemográficos
Resumo
Resumo: Recentemente, tem havido um aumento no uso de ferramentas de data mining na extraçao de informações relevantes de bases de dado educacionais, sendo que tal processo recebe o nome de Educational Data Mining. Considerando a grande incidência de evasão nas universidades públicas brasileiras, existe uma grande importˆancia na identificação precoce de alunos que possu'issem um risco de evasão. Tendo em vista o grande efeito de reprovações no aumento da probabilidade de evasão, este artigo traz a comparação de diferentes abordagens na identificação de alunos que possuem o maior risco de reprovar em determinada disciplina. Os seguintes métodos foram implementados em uma base real de alunos da UFPR: Support Vector Machines, Redes Neurais Profundas e Random Forests. Todos os algoritmos foram testados em uma base contendo unicamente os dados de histórico acadêmico e outra contendo os dados de histórico e dados socioeconômicos a fim de identificar as vari'aveis de maior relevância para o aumento no risco de reprovação. De todos os métodos mostrados, o Random Forest utilizando dados de histórico escolar e dados socioeconômicos mostrou a melhor performance para o problema apresentado.