Mostrar registro simples

dc.contributor.advisorHara, Carmem Satie, 1964-pt_BR
dc.contributor.authorPrado, Rafael de Lima, 1990-pt_BR
dc.contributor.otherUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informáticapt_BR
dc.date.accessioned2019-04-08T16:29:06Z
dc.date.available2019-04-08T16:29:06Z
dc.date.issued2017pt_BR
dc.identifier.urihttps://hdl.handle.net/1884/59443
dc.descriptionOrientadora: Prof.a Dr.a Carmem Satie Harapt_BR
dc.descriptionDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 29/01/2018pt_BR
dc.descriptionInclui referências: p. 57-58pt_BR
dc.description.abstractResumo: A Web Semântica tem por objetivo tornar compreensíveis as informações disponíveis na Internet para as máquinas. O RDF é o modelo de dados padrão para a Web Semântica. Bases RDF são compostas por triplas (sujeito, predicado, objeto) e o SPARQL é a linguagem de consultas para RDF recomendado pelo W3C. Uma consulta define um padrão de triplas a ser encontrado na base de dados. Como o objeto de uma tripla pode ser o sujeito de outra, uma consulta SPARQL pode ser vista como a busca de um subgrafo no grafo que representa a base RDF. Dada a complexidade deste problema, a otimização do acesso às bases RDF é um desafio a ser enfrentado. Algumas abordagens têm surgido nesse contexto, representando os dados RDF em outros formatos, como, por exemplo, no modelo relacional. Nesse tipo de abordagem, os dados RDF são armazenados em um Sistema Gerenciador de Banco de Dados Relacional(SBGDR). A forma direta de mapeamento de dados RDF para uma base relacional se dá por meio de uma tabela SPO, ou seja, com três atributos - sujeito, predicado e objeto. Porém, esse método em geral não possui bom desempenho, uma vez que toda a base é armazenada em uma única tabela e consultas nessa tabela que envolvem mais de um padrão de triplas implicam na execução de auto-junções. O Armazenamento Otimizado de Dados RDF em um SGBD Relacional - AORR, proposto nesta dissertação, surge como uma forma alternativa de armazenamento de dados RDF em um SGBDR. O intuito é que consultas sobre o AORR possuam desempenho superior às realizadas sobre as tabelas SPO oriundas da abordagem direta. Tal ganho do AORR deve-se, principalmente, à identificação de entidades com estruturas similares na base RDF e a geração de uma tabela para cada entidade no esquema relacional. Dessa forma é minimizado a quantidade de junções a serem executadas para o processamento de consultas. Consultas SPARQL podem ser realizadas sobre a base relacional gerada devido às tabelas de metadados que o AORR cria no processo de extração de esquema. As informações de mapeamento armazenada nas tabelas de metadado possibilitam a tradução de consultas SPARQL para SQL. Elas também permitem que o AORR dê suporte a atualizações incrementais da base. Os resultados dos experimentos mostram que as consultas realizadas sobre a base gerada pelo AORR apresentam melhor desempenho que uma abordagem alternativa baseada em tabelas de entidade para o armazenamento de dados RDF. Palavras-chave: RDF. SPARQL. Metadado. SGBDR.pt_BR
dc.description.abstractAbstract: The main goal of the Semantic Web is to make machines understand the information available on the Internet. RDF is the Semantic Web standard data model. RDF databases consist of triples (subject, predicate, object). The W3C (World Wide Web Consortium) recommends SPARQL as the query language for RDF. A query in RDF involves searching for triple patterns in a database. Since the object of a triple can be the subject of another, SPARQL queries can interpreted as a problem of subgraph match on the graph representing an RDF database. Given the complexity of the problem, optimizing the access to RDF databases is a hard problem. One of the possible approaches to tackle this problem is to store RDF data in a different format, for example, the relational model. A direct mapping from RDF to the relational model stores the entire database in an SPO table (subject, predicate, object). However this mapping does not present a good performance because queries involving more than one triple pattern require auto-joins on this table. This dissertation proposes AORR (Armazenamento Otimizado de Dados RDF em um SGBD Relational) as an alternative approach to store RDF data in a Relational Database Management System (RDBMS). AORR identifies entities with similar structure in the RDF database and creates a table in the relational database for each entity. This table stores several predicates associated with the same subject and thus the amount of auto-joins to process queries is minimized. SPARQL queries can be translated to SQL on the resulting relacional database due metadata tables that AORR generates during the schema extraction process. These metadata tables also enables incremental updates of the database. The experimental results show that queries executed on AORR have better performance than an alternative approach based on entity tables for storing RDF data. Keywords: RDF. SPARQL. Metadata. RDBMS.pt_BR
dc.format.extent82 p. : il. (algumas color.).pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.subjectArmazenamento de dadospt_BR
dc.subjectCiência da Computaçãopt_BR
dc.subjectBanco de dados relacionaispt_BR
dc.subjectBanco de dados - Gerenciapt_BR
dc.subjectMetadadospt_BR
dc.titleArmazenamento otimizado de dados RDF em um SGBD relacionalpt_BR
dc.typeDissertação Digitalpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples