数据库与信息系统研究室师生论文被国际学术会议EMNLP 2021录用
近日,国际NLP领域顶级会议EMNLP 2021公布论文录取结果。数据库与信息系统研究室2篇论文被录用。
EMNLP(Conference on Empirical Methods in Natural Language Processing)是计算语言学和自然语言处理领域的顶级国际会议之一,由国际语言学会(ACL)旗下SIGDAT组织。EMNLP论文入选标准十分严格,今年论文录取率仅23.3%,相比去年略有下降。EMNLP学术会议上展示的研究成果,被认为代表着自然语言处理领域的前沿水平与未来发展方向。
以下为论文介绍:
1.论文题目:TEMP: Taxonomy Expansion with Dynamic Margin Loss through Taxonomy-Paths
作者:刘子晨,徐鸿渊,温延龙,蒋宁, 吴海英, 袁晓洁
通讯作者:温延龙
录用会议/期刊:EMNLP 2021
论文概述:
分类体系是一种通过上下位关系 (也称为 “is-a”关系) 组织实体的树状语义层次结构。 其在很多自然语言处理任务中起着重要作用,比如:问答任务,查询理解和信息抽取。手动构建的分类体系通常面临覆盖范围有限的问题,尤其是当新概念不断出现时。低覆盖率分类体系会在很大程度上损害依赖它的下游任务的性能。此外,为了维护和扩展现有分类体系,需要领域专家进行管理,这个过程昂贵又耗时。因此,本文研究了自动分类体系扩展任务(如图1):给定现有的分类体系、文本语料库和一组概念,任务目标是通过向其中插入概念来扩展分类体系。我们提出的方法,TEMP,首个使用微调预训练语言模型在该任务。同时,在 TEMP 中使用基于动态差额排名损失和新的动态边距函数,使模型学习分类路径之间的判别差异。
2.论文题目:Incorporating Circumstances into Narrative Event Prediction
作者:王施超,蔡祥睿,王洪斌,袁晓洁
通讯作者:蔡祥睿
录用会议/期刊:findings of EMNLP 2021
论文概述:
为了发现事件的演化,叙事性事件的预测对于建模复杂的现实世界事件至关重要。现有的研究集中于挖掘事件间的关系,而忽略了事件是如何发生的,我们称之为场景。然而我们观察到,这些场景含蓄地暗示了事件的进化,并且对叙事事件的预测具有重要意义。为了将场景纳入叙事性事件的预测,我们提出了CircEvent,它采用多头注意力在局部和全局层面上检索场景。我们还引入了注意力权重的正则化,以利用事件和局部场景之间的对齐。实验结果表明,CircEvent比现有基线高出12.2%。进一步的分析证明了我们的多头注意模块和正则化的有效性。