张旻昊关于知识图谱自然语言问答的论文“NAMER: A Node-Based Multitasking Framework for Multi-Hop Knowledge Base Question Answering”被NAACL 2021接收。
在基于语义解析的知识图谱自然语言问答中,准确地把握问题与查询语句之间的语义对应关系是取得优异表现的关键。我们发现,SPARQL查询语句中的每个节点(node)与其在问题中的提及(mention)之映射关系很大程度上反映了问题与查询语句之间的语义对应。然而,多数此前的工作或仅部分利用,或完全忽略了这种node-mention对应关系,这都让模型难以直接而全面地学习问题与SPARQL查询间的映射,进而影响系统表现。
在本文中,我们给出了针对SPARQL语句上述node-mention对应关系的定义,并设计了一种创新性开放领域知识库问答框架,NAMER,以使系统全面学习此关系;该框架在中文开放领域复杂KBQA数据集CKBQA上取得了最优(state-of-the-art)表现,证明了我们方法的有效性。为了实现这一系统,我们在CKBQA数据集基础上补充了额外的标注信息,这些标注目前已经开源,我们期待它能进一步推动未来的相关研究。此外,基于本文提出的方法,我们实现了一个公开的线上知识库问答网页,实现基本KBQA功能的同时,该网页还提供了额外信息,帮助用户理解系统架构、探索知识图谱。