数据库与信息系统研究室师生论文被国际学术会议ACL 2021录用
论文题目:An End-to-End Progressive Multi-Task Learning Framework for Medical Named Entity Recognition and Normalization
作者:周宝航,蔡祥睿,张莹,袁晓洁
通讯作者:张莹
录用会议/期刊:ACL 2021
论文概述:医学命名实体识别(NER)和规范化(NEN)是构建知识图谱和问答系统的基础。现有的医疗NER和NEN模型存在两个任务之间的错误传播问题。NER的错误预测将直接影响NEN的结果。因此,NER模块是整个系统的瓶颈。此外,这两个任务的可学习特征有助于提高模型的性能。为了避免现有模型的缺点,利用两个任务的泛化表示,我们设计了一个端到端渐进式的多任务学习模型,有效地联合建模医学NER和NEN。在这个框架中有三个难度循序渐进的子任务。渐进式任务可以通过增量任务的设置来减少错误的传播,这意味着较低级别的任务可以从较高级任务获得监督信号而不是错误,从而提高其性能。此外,利用上下文特征丰富了实体提及的语义信息。NEN的性能受益于增强的实体提及特征。将知识库中的标准实体引入NER模块,正确提取对应的实体提及。在两个公开的医学文献数据集上的实验结果表明,我们的方法优于九种典型方法。