Arquitetura MCGML : classificando modelos desestruturados usando aprendizado de máquina em grafos
Resumo
Resumo: Modelos e metamodelos criados usando abordagens baseadas em modelos têm relações de conformidades restritas. No entanto, houve um aumento nos formatos de dados livres de schemas ou semiestruturados, tais como as representações orientadas a documentos, as quais geralmente são persistidas como documentos JSON. Apesar de não terem um metamodelo/schema explícitos, esses documentos poderiam ser categorizados visando obter conhecimento sobre seus domínios, e conformá-los parcialmente aos seus respectivos metamodelos. Abordagens recentes estão surgindo objetivando extrair informações ou combinar soluções de modelagem com cognificação. Existe porém uma carência de abordagens que explorem a classificação de formatos semiestruturados. Esta tese aborda justamente essas limitações, apresentando a Arquitetura MCGML (Model Classification using Graph Machine Learning): uma abordagem para analisar e classificar modelos desestruturados usando Aprendizado de Máquina em Grafos. Primeiro descrevemos nossa primeira etapa de pesquisa que diz respeito ao processo de extração de elementos de um metamodelo para dentro de uma rede neural Multi-Layer Perceptron (MLP) para que a mesma possa ser treinada. Em seguida convertemos documentos JSON em um formato de entrada codificado para a MLP. Apresentaremos nesta tese, o passo a passo para classificar documentos JSON de acordo com metamodelos existentes extraídos a partir de um repositório. Em seguida apresentamos a Arquitetura MCGML com o objetivo de classificar e analisar similaridades em modelos e metamodelos através da análise de grafos e os algoritmos de Machine Learning (ML). Mostramos também uma série de experimentos para demonstrar a viabilidade da arquitetura MCGML e sua efetividade em classificar documentos. Abstract: Models and metamodels created using model-based approaches have restrict conformance relations. However, there has been an increase of semi-structured or schema-free data formats, such as document-oriented representations, which are often persisted as JSON documents. Despite not having an explicit schema/metamodel, these documents could be categorized to discover their domain and to partially conform to a metamodel. Recent approaches are emerging to extract information or to couple modeling with cognification. However, there is a lack of approaches exploring semi-structured formats classification. In this thesis, we address precisely these limitations, we present MCGML Architecture (Model Classification using Graph Machine Learning): an approach to analyze and classify unstructured models using Graph Machine Learning. First, we describe our first research stage that concerns how to extract metamodels elements into a Multi-Layer Perceptron (MLP) network to be trained. Then, we translate the JSON documents into the input format of the encoded MLP. We present the step-by-step tasks to classify JSON documents according to existing metamodels extracted from a repository. Then we present the MCGML Architecture in order to classify and analyze similarities in models and metamodels through graph analysis and Machine Learning (ML) algorithms. We have conducted a set of experiments, showing that the approach is feasible, and its effectiveness in classifying documents.
Collections
- Teses [126]