实验室动态

[2023 SIGIR] Exploiting Ubiquitous Mentions in Document-Level Relation Extraction

张若禹关于改善文档级别关系抽取中的指代词的论文《Exploiting Ubiquitous Mentions in Document-Level Relation Extraction》被SIGIR 2023接收。在本文中,我们研究了现有的文档级别关系抽取数据中的指代缺失的问题,并通过实验证明了该问题在多方面阻碍了关系抽取模型的推理。为了改善这一问题,我们提出将代词、常见名词等语言表达也加入指代词中。我们在DocRED数据集上重新标注了指代关系,并发布了新数据集R-DocRED。实验表明,新加入的指代词可以缓解长距离依赖等问题,并且能有效提升各种方法在低资源或对抗环境下的泛化性与鲁棒性。