[2017 TKDE] Answering Natural Language Questions by Subgraph Matching over Knowledge Graphs
胡森关于知识库上进行自然语言问答(QA)的论文(Answering Natural Language Questions by Subgraph Matching over Knowledge Graphs))被 TKDE 2017 录用。
这篇论文是邹磊发表在 SIGMOD 2014 的 QA 论文的扩展,采用基于语义解析的方法,先将自然语言问题转化成语义查询图,再在知识图谱中寻找合适的匹配。核心的扩展内容在于将之前的工作总结为关系优先的方法(Relation-first framework)并分析缺陷,从而提出了节点优先的方法(Node-first framework)。在关系优先的方法中,语义查询图的结构是固定的,依赖于语法解析树(dependency parse tree)上的启发式规则,并且无法处理隐式关系。与之相反,新提出的节点优先的方法不依赖模板和启发式规则,具备较强的鲁棒性。它生成的语义查询图允许包含错误边,这些错误边会在查询执行阶段根据匹配情况被抛弃,从而能够处理更复杂的问题。与此同时,节点优先的方法在离线索引中挖掘频繁模式来支持隐式关系,并设计了高效的子图匹配算法支持语义查询图的 Top-k 检索。实验结果表明该方法在准确度和效率上均优于已有工作。