实验室动态

[2016 VLDB] Processing SPARQL queries over distributed RDF graphs

彭鹏关于分布式环境下 RDF 数据上的 SPARQL 查询处理的论文(Processing SPARQL queries over distributed RDF graphs)被 VLDB 2016 录用。

论文针对不能进行数据划分的分布式 RDF 数据库系统提出了一个基于局部计算的查询处理框架。这个框架中,系统中每台机器根据自身上所存储的 RDF 数据计算出整个 SPARQL 查询的局部匹配。所找出的局部匹配被定义为本地局部匹配。基于本地局部匹配的定义,实现了一个高效的本地局部匹配求解算法。然后,所有被找出的局部匹配被归并起来并通过连接操作合并成最终匹配。因为这一框架是处理整个 SPARQL 查询而无需进行查询分解,所以这一方法是独立于数据划分的。而且根据我们定义所找出的本地局部匹配能保证计算过程中系统所产生中间结果涉及的点和边的数量是最少的。