It is crucial to understand a specific domain by events. Extensive event extraction research has been conducted in many domains such as news, finance, and biology. However, event extraction in scientific domain is still insufficiently supported by comprehensive datasets and tailored methods. Compared with other domains, scientific domain has two characteristics: (1) denser nuggets and events, and (2) more complex information forms. To solve the above problem, considering these two characteristics, we first construct SciEvents, a large-scale multi-event document-level dataset with a schema tailored for scientific domain. It consists of 2,508 documents and 24,381 events under multi-stage manual annotation and quality control. Then, we propose EXCEEDS, an end-to-end scientific event extraction framework by encoding dense nuggets into a grid matrix and simplifying complex event extraction as a nugget-based grid modeling task. Experiments on SciEvents demonstrate state-of-the-art performances of EXCEEDS. Both the SciEvents dataset and the EXCEEDS framework are released publicly to facilitate future research.


翻译:通过事件理解特定领域至关重要。尽管在新闻、金融、生物学等领域已开展了大量事件抽取研究,但科学领域的事件抽取仍缺乏全面数据集和定制化方法的充分支持。与其他领域相比,科学领域具有两大特征:(1)要素与事件密度更高;(2)信息形式更为复杂。针对上述问题,本文结合这两大特征,首先构建了SciEvents——一个为科学领域定制模式的大规模多事件文档级数据集。该数据集包含2,508篇文档和24,381个事件,并经过多阶段人工标注与质量控制。随后,我们提出EXCEEDS——一种端到端的科学事件抽取框架,通过将密集要素编码为网格矩阵,将复杂事件抽取简化为基于要素的网格建模任务。在SciEvents上的实验表明,EXCEEDS取得了最先进的性能。为促进后续研究,我们公开发布了SciEvents数据集与EXCEEDS框架。

0
下载
关闭预览

相关内容

面向研究问题的深度学习事件抽取综述
专知会员服务
26+阅读 · 2024年12月9日
「深度学习事件抽取」最新2022研究综述
专知会员服务
72+阅读 · 2022年6月2日
北航《深度学习事件抽取》文献综述和当前趋势
专知会员服务
87+阅读 · 2021年7月6日
专知会员服务
24+阅读 · 2021年6月19日
专知会员服务
80+阅读 · 2021年5月27日
NLP 事件抽取综述(中)—— 模型篇
深度学习自然语言处理
21+阅读 · 2020年12月28日
【SCIR笔记】文档级事件抽取简述
深度学习自然语言处理
17+阅读 · 2020年7月30日
实体关系抽取方法研究综述
专知
14+阅读 · 2020年7月19日
赛尔笔记 | 多模态信息抽取简述
专知
29+阅读 · 2020年4月12日
【工大SCIR笔记】多模态信息抽取简述
深度学习自然语言处理
19+阅读 · 2020年4月3日
论文浅尝 | 使用循环神经网络的联合事件抽取
开放知识图谱
25+阅读 · 2019年4月28日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
综述 | 事件抽取及推理 (上)
开放知识图谱
87+阅读 · 2019年1月9日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
VIP会员
最新内容
《通过小型无人机系统将情报能力“作战化”》
专知会员服务
4+阅读 · 今天7:28
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
《离线语言支持系统:面向空战战术决策》
专知会员服务
8+阅读 · 6月15日
相关资讯
NLP 事件抽取综述(中)—— 模型篇
深度学习自然语言处理
21+阅读 · 2020年12月28日
【SCIR笔记】文档级事件抽取简述
深度学习自然语言处理
17+阅读 · 2020年7月30日
实体关系抽取方法研究综述
专知
14+阅读 · 2020年7月19日
赛尔笔记 | 多模态信息抽取简述
专知
29+阅读 · 2020年4月12日
【工大SCIR笔记】多模态信息抽取简述
深度学习自然语言处理
19+阅读 · 2020年4月3日
论文浅尝 | 使用循环神经网络的联合事件抽取
开放知识图谱
25+阅读 · 2019年4月28日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
综述 | 事件抽取及推理 (上)
开放知识图谱
87+阅读 · 2019年1月9日
相关基金
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员