Uma abordagem para filtragem de arestas de grafos de palavras aplicada ao problema de classificação de texto

Oliveira, Marcela Ribeiro de, 1996-

dc.contributor.advisor	Spinosa, Eduardo Jaques, 1974-	pt_BR
dc.contributor.author	Oliveira, Marcela Ribeiro de, 1996-	pt_BR
dc.contributor.other	Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática	pt_BR
dc.date.accessioned	2021-06-21T17:45:12Z
dc.date.available	2021-06-21T17:45:12Z
dc.date.issued	2020	pt_BR
dc.identifier.uri	https://hdl.handle.net/1884/70832
dc.description	Orientador: Eduardo Jaques Spinosa	pt_BR
dc.description	Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 09/12/2020	pt_BR
dc.description	Inclui referências: p. 83-86	pt_BR
dc.description	Área de concentração: Ciência da Computação	pt_BR
dc.description.abstract	Resumo: Classificação de texto é um problema clássico na área de Processamento de Linguagem Natural. Uma tarefa essencial na classificação de texto é a construção da representação, que deve prover informações relevantes para o classificador. Um dos modelos de representação mais efetivos utiliza grafos para representar textos. Esta pesquisa propõe uma abordagem que utiliza esse modelo de representação e medidas de associatividade de palavras para incorporar mais informações aos grafos. Essas medidas servem como um guia para identificar e remover arestas entre as palavras com baixo valor de associatividade. Então, utilizando o node2vec, extraímos as características de cada grafo e utilizamos uma rede neural convolucional de texto para realizar a classificação. Conduzimos experimentos para comparar diferentes tipos de modelagem dos grafos em termos de acerto na classificação e da proporção de arestas que foram removidas. Os resultados obtidos indicaram que essa abordagem torna possível reduzir a quantidade de arestas no grafo mantendo o desempenho da classificação. Palavras-chave: classificação de texto, grafo de palavras, aprendizagem de representação de grafos.	pt_BR
dc.description.abstract	Abstract: Text classification is a classic problem in Natural Language Processing. An essential task in text classification is the construction of the representation, which must provide relevant information to the classifier. One of the most effective representation model uses graphs to represent texts. This research proposes an approach that uses this representation model and word association measures to incorporate more information into the graphs. These measures then serve as a guide to identify and remove edges between words with low association levels. Then, using node2vec, we extract the features of each graph and use a text convolutional neural network for classification. We conducted experiments in order to compare different kinds of graph modeling in terms of classification score and the proportion of edges that were removed. The results obtained indicate that this approach makes it possible to reduce the amount of edges in the graphs maintaining classification performance. Keywords: text classification, graph of words, graph representation learning	pt_BR
dc.format.extent	1 arquivo (105 p.) : il. (algumas color.).	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language	Português	pt_BR
dc.subject	Teoria dos grafos	pt_BR
dc.subject	Processamento eletronico de dados	pt_BR
dc.subject	Algorítmos	pt_BR
dc.subject	Ciência da Computação	pt_BR
dc.title	Uma abordagem para filtragem de arestas de grafos de palavras aplicada ao problema de classificação de texto	pt_BR
dc.type	Dissertação Digital	pt_BR

Arquivos deste item

Nome:: R - D - MARCELA RIBEIRO DE ...
Tamanho:: 5.120Mb
Formato:: PDF

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Dissertações [270]

Mostrar registro simples