Modelo computacional e sua implementação para identificação de perfil de personalidade baseado em textos educacionais
Resumo
Resumo: A identificacao do perfil de personalidade de alunos, levando em consideracao as diferencas, colabora com os educadores no processo de encontrar situacoes de aprendizagem adequadas para cada aluno. Este processo pode ser realizado de forma intuitiva em pequenas turmas presenciais, mas apresenta-se como um grande desafio no cenario de grandes turmas em ambientes a distancia. Uma das formas de identificar o perfil de personalidade e a utilizacao dos inventarios de personalidade, nos quais os alunos respondem a uma serie de perguntas que sao posteriormente avaliadas, gerando os indicadores de perfil de personalidade de acordo com um modelo especifico. Em contrapartida a esses metodos manuais de aplicacao de inventarios, tem-se desenvolvido metodos nao intrusivos, baseados, por exemplo, na identificacao das pistas de personalidade registradas pelos individuos nos textos por estes produzidos. Com a utilizacao de processos de aprendizado de maquina, as pistas identificadas nos textos podem ser comparadas as pistas identificadas em bases de dados de referencia, nas quais um processo previo de identificacao manual foi realizado, inferindo-se assim o perfil de personalidade dos autores dos textos. Esta pesquisa apresenta um modelo, denominado IP3, que permite a realizacao da identificacao automatica do perfil de personalidade de alunos, de uma forma nao intrusiva, tendo como referencia somente o texto em portugues registrado por estes alunos em atividades educacionais. Este modelo e baseado em aprendizado de maquina, utilizando bases de aprendizado previamente rotuladas, modelos de representacao do texto e tecnicas de classificacao. Como base de treinamento e referencia para os testes dos classificadores, foram utilizadas as bases ESSAYS e myPersonality, bases estas utilizadas por diversas pesquisas na area de identificacao de personalidade a partir do texto. Para a representacao do texto foi utilizado o lexico LIWC, bem como a representacao estatistica nos modelos n-gram e Word2Vec. Tambem foram avaliadas as tecnicas utilizadas para classificacao de texto, sendo proposta a utilizacao da estrategia de combinacao de classificadores. Com o objetivo de validar o modelo apresentado, foi realizado um experimento pratico em um ambiente educacional. Os resultados apresentados demonstram a viabilidade da utilizacao do modelo IP3 para identificacao do perfil de personalidade dos alunos baseado somente nos textos registrados em ambientes educacionais. Palavras-chave: identificacao de personalidade, classificacao de texto, representacao de texto, processamento de linguagem natural, aprendizado de maquina. Abstract: The personality profile identification of students supports educators in the process of finding suitable learning conditions for each student while considering their differences. Although this process can be used in an intuitive way for small groups in classroom learning, it proves to be a significant challenge in the landscape of large distance learning groups. One way of identifying the personality profile is by using the personality inventory. By using this method, students answer a series of questions that are later evaluated, generating personality profile indicators according to a specific model. In contrast to that, we can find the use of non-intrusives methods. They are based on the identification of personality clues which can be derived from the text produced by individuals. With the use of machine learning processes, these clues are identified within the text and can be compared to the clues found in databases of reference, in which an inference of a personality profile has been identified, through a previous manual identification process. This research had the purpose of obtaining a model, named IP3, that allows the identification of students' profile in a non-intrusive way. It considered only text in portuguese produced by these students in their educational activities. To conduct this research, the author investigated text representation techniques that allowed to obtain clues about the writer. The methods used in this research were the LIWC lexicon as well as the statistic representation in the n-gram and Word2Vec models. Additionally, the classification and the classifiers combination specification techniques were also evaluated in the proposed model. As a training basis and reference for the classifiers' tests, ESSAYS and myPersonality databases have been used, which are commonly used by several researchers in the field of personality identification from text. To validate the model presented, a practical experiment was conducted in an educational environment. The presented results indicate the viability regarding the use of the IP3 student's personality profile identification model, based on the text produced by them during educational activities. Keywords: personality recognition, text classification, text representation, natural language processing, machine learning.
Collections
- Teses [124]