A Multimodal Text- and Graph-Based Approach for Open-Domain Event Extraction from Documents - 专知论文

会员服务 ·

0

事件 · 事件抽取 · 开放域 · 算法 · 多模 ·

A Multimodal Text- and Graph-Based Approach for Open-Domain Event Extraction from Documents

翻译：基于多模态文本和图方法的开放域文档事件抽取

Event extraction is essential for event understanding and analysis. It supports tasks such as document summarization and decision-making in emergency scenarios. However, existing event extraction approaches have limitations: (1) closed-domain algorithms are restricted to predefined event types and thus rarely generalize to unseen types and (2) open-domain event extraction algorithms, capable of handling unconstrained event types, have largely overlooked the potential of large language models (LLMs) despite their advanced abilities. Additionally, they do not explicitly model document-level contextual, structural, and semantic reasoning, which are crucial for effective event extraction but remain challenging for LLMs due to lost-in-the-middle phenomenon and attention dilution. To address these limitations, we propose multimodal open-domain event extraction, MODEE , a novel approach for open-domain event extraction that combines graph-based learning with text-based representation from LLMs to model document-level reasoning. Empirical evaluations on large datasets demonstrate that MODEE outperforms state-of-the-art open-domain event extraction approaches and can be generalized to closed-domain event extraction, where it outperforms existing algorithms.

翻译：事件抽取对于事件理解与分析至关重要，它支持文档摘要和紧急场景下的决策制定等任务。然而，现有的事件抽取方法存在局限性：（1）封闭域算法局限于预定义的事件类型，因此难以泛化到未见过的类型；（2）开放域事件抽取算法虽能处理不受约束的事件类型，但在很大程度上忽略了大型语言模型（LLMs）的先进能力。此外，这些算法未能显式建模文档级别的上下文、结构和语义推理——这些对于有效的事件抽取至关重要，但由于中间信息丢失和注意力稀释现象，对LLMs而言仍具有挑战性。为解决这些局限性，我们提出多模态开放域事件抽取方法MODEE，这是一种结合基于图的LLMs文本表示学习的新颖开放域事件抽取方法，用于建模文档级推理。在大型数据集上的实证评估表明，MODEE优于最先进的开放域事件抽取方法，并且可以泛化到封闭域事件抽取场景，在此场景中其性能优于现有算法。

0

相关内容

大语言模型中的事件抽取：方法、模态与未来展望的全面综述

大语言模型中的事件抽取：方法、模态与未来展望的全面综述

专知会员服务

19+阅读 · 2025年12月23日

【WWW2025】基于多模态图结构的专家混合变分网络—零样本多模态信息抽取方法

【WWW2025】基于多模态图结构的专家混合变分网络—零样本多模态信息抽取方法

专知会员服务

14+阅读 · 2025年3月31日

【阿姆斯特丹博士论文】超越边界：迈向可泛化的信息抽取框架，126页pdf

【阿姆斯特丹博士论文】超越边界：迈向可泛化的信息抽取框架，126页pdf

专知会员服务

24+阅读 · 2024年12月12日

面向研究问题的深度学习事件抽取综述

面向研究问题的深度学习事件抽取综述

专知会员服务

26+阅读 · 2024年12月9日

【NTU博士论文】将上下文融入开放信息抽取

【NTU博士论文】将上下文融入开放信息抽取

专知会员服务

21+阅读 · 2024年11月11日

CMNEE：基于开源中国军事新闻的大规模文档级事件抽取数据集

CMNEE：基于开源中国军事新闻的大规模文档级事件抽取数据集

专知会员服务

48+阅读 · 2024年6月2日

「深度学习事件抽取」最新2022研究综述

「深度学习事件抽取」最新2022研究综述

专知会员服务

72+阅读 · 2022年6月2日

北航《深度学习事件抽取》文献综述和当前趋势

北航《深度学习事件抽取》文献综述和当前趋势

专知会员服务

87+阅读 · 2021年7月6日

ACL2021 | OntoED：利用本体表示学习实现低资源的事件抽取

专知会员服务

24+阅读 · 2021年6月19日

基于深度学习的事件因果关系抽取综述

专知会员服务

80+阅读 · 2021年5月27日

NLP 事件抽取综述（中）—— 模型篇

NLP 事件抽取综述（中）—— 模型篇

深度学习自然语言处理

21+阅读 · 2020年12月28日

【SCIR笔记】文档级事件抽取简述

【SCIR笔记】文档级事件抽取简述

深度学习自然语言处理

17+阅读 · 2020年7月30日

【关系抽取】从文本中进行关系抽取的几种不同的方法

【关系抽取】从文本中进行关系抽取的几种不同的方法

深度学习自然语言处理

29+阅读 · 2020年3月30日

论文浅尝 | Doc2EDAG：一种针对中文金融事件抽取的端到端文档级框架

论文浅尝 | Doc2EDAG：一种针对中文金融事件抽取的端到端文档级框架

开放知识图谱

35+阅读 · 2019年10月7日

论文浅尝 | 使用循环神经网络的联合事件抽取

论文浅尝 | 使用循环神经网络的联合事件抽取

开放知识图谱

25+阅读 · 2019年4月28日

综述 | 事件抽取及推理 (下)

综述 | 事件抽取及推理 (下)

开放知识图谱

38+阅读 · 2019年1月14日

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

开放知识图谱

26+阅读 · 2018年11月1日

赛尔原创 | 基于连通图的篇章级事件抽取与相关度计算

赛尔原创 | 基于连通图的篇章级事件抽取与相关度计算

哈工大SCIR

12+阅读 · 2018年4月23日

赛尔原创 | 搭建基于依存句法和短语结构句法结合的金融领域事件元素抽取系统实践

赛尔原创 | 搭建基于依存句法和短语结构句法结合的金融领域事件元素抽取系统实践

哈工大SCIR

19+阅读 · 2017年12月22日

回顾 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

回顾 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

机器学习研究会

19+阅读 · 2017年12月15日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

抽样环境下基于流记录的行为特征分析与多分类器识别模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

社会化多媒体中的事件分析研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

EVENT5Ws: A Large Dataset for Open-Domain Event Extraction from Documents

Arxiv

0+阅读 · 4月23日

Scattered Hypothesis Generation for Open-Ended Event Forecasting

Arxiv

0+阅读 · 4月17日

Advancing Object-Centric Process Mining with Multi-Dimensional Data Operations

Arxiv

0+阅读 · 4月7日

FileGram: Grounding Agent Personalization in File-System Behavioral Traces

Arxiv

0+阅读 · 4月6日

AnnoRetrieve: Efficient Structured Retrieval for Unstructured Document Analysis

Arxiv

0+阅读 · 4月3日

Text Data Integration

Arxiv

0+阅读 · 3月28日

Time and Relations into Focus: Ontological Foundations of Object-Centric Event Data

Arxiv

0+阅读 · 3月23日

Event-Centric Human Value Understanding in News-Domain Texts: An Actor-Conditioned, Multi-Granularity Benchmark

Arxiv

0+阅读 · 3月18日

Hyperbolic Multimodal Generative Representation Learning for Generalized Zero-Shot Multimodal Information Extraction

Arxiv

0+阅读 · 3月17日

Graph Neural Networks for Text Classification: A Survey

Arxiv

34+阅读 · 2023年4月27日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

大语言模型中的事件抽取：方法、模态与未来展望的全面综述

大语言模型中的事件抽取：方法、模态与未来展望的全面综述

专知会员服务

19+阅读 · 2025年12月23日

【WWW2025】基于多模态图结构的专家混合变分网络—零样本多模态信息抽取方法

【WWW2025】基于多模态图结构的专家混合变分网络—零样本多模态信息抽取方法

专知会员服务

14+阅读 · 2025年3月31日

【阿姆斯特丹博士论文】超越边界：迈向可泛化的信息抽取框架，126页pdf

【阿姆斯特丹博士论文】超越边界：迈向可泛化的信息抽取框架，126页pdf

专知会员服务

24+阅读 · 2024年12月12日

面向研究问题的深度学习事件抽取综述

面向研究问题的深度学习事件抽取综述

专知会员服务

26+阅读 · 2024年12月9日

【NTU博士论文】将上下文融入开放信息抽取

【NTU博士论文】将上下文融入开放信息抽取

专知会员服务

21+阅读 · 2024年11月11日

CMNEE：基于开源中国军事新闻的大规模文档级事件抽取数据集

CMNEE：基于开源中国军事新闻的大规模文档级事件抽取数据集

专知会员服务

48+阅读 · 2024年6月2日

「深度学习事件抽取」最新2022研究综述

「深度学习事件抽取」最新2022研究综述

专知会员服务

72+阅读 · 2022年6月2日

北航《深度学习事件抽取》文献综述和当前趋势

北航《深度学习事件抽取》文献综述和当前趋势

专知会员服务

87+阅读 · 2021年7月6日

ACL2021 | OntoED：利用本体表示学习实现低资源的事件抽取

专知会员服务

24+阅读 · 2021年6月19日

基于深度学习的事件因果关系抽取综述

专知会员服务

80+阅读 · 2021年5月27日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

NLP 事件抽取综述（中）—— 模型篇

NLP 事件抽取综述（中）—— 模型篇

深度学习自然语言处理

21+阅读 · 2020年12月28日

【SCIR笔记】文档级事件抽取简述

【SCIR笔记】文档级事件抽取简述

深度学习自然语言处理

17+阅读 · 2020年7月30日

【关系抽取】从文本中进行关系抽取的几种不同的方法

【关系抽取】从文本中进行关系抽取的几种不同的方法

深度学习自然语言处理

29+阅读 · 2020年3月30日

论文浅尝 | Doc2EDAG：一种针对中文金融事件抽取的端到端文档级框架

论文浅尝 | Doc2EDAG：一种针对中文金融事件抽取的端到端文档级框架

开放知识图谱

35+阅读 · 2019年10月7日

论文浅尝 | 使用循环神经网络的联合事件抽取

论文浅尝 | 使用循环神经网络的联合事件抽取

开放知识图谱

25+阅读 · 2019年4月28日

综述 | 事件抽取及推理 (下)

综述 | 事件抽取及推理 (下)

开放知识图谱

38+阅读 · 2019年1月14日

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

开放知识图谱

26+阅读 · 2018年11月1日

赛尔原创 | 基于连通图的篇章级事件抽取与相关度计算

赛尔原创 | 基于连通图的篇章级事件抽取与相关度计算

哈工大SCIR

12+阅读 · 2018年4月23日

赛尔原创 | 搭建基于依存句法和短语结构句法结合的金融领域事件元素抽取系统实践

赛尔原创 | 搭建基于依存句法和短语结构句法结合的金融领域事件元素抽取系统实践

哈工大SCIR

19+阅读 · 2017年12月22日

回顾 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

回顾 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

机器学习研究会

19+阅读 · 2017年12月15日

相关论文

EVENT5Ws: A Large Dataset for Open-Domain Event Extraction from Documents

Arxiv

0+阅读 · 4月23日

Scattered Hypothesis Generation for Open-Ended Event Forecasting

Arxiv

0+阅读 · 4月17日

Advancing Object-Centric Process Mining with Multi-Dimensional Data Operations

Arxiv

0+阅读 · 4月7日

FileGram: Grounding Agent Personalization in File-System Behavioral Traces

Arxiv

0+阅读 · 4月6日

AnnoRetrieve: Efficient Structured Retrieval for Unstructured Document Analysis

Arxiv

0+阅读 · 4月3日

Text Data Integration

Arxiv

0+阅读 · 3月28日

Time and Relations into Focus: Ontological Foundations of Object-Centric Event Data

Arxiv

0+阅读 · 3月23日

Event-Centric Human Value Understanding in News-Domain Texts: An Actor-Conditioned, Multi-Granularity Benchmark

Arxiv

0+阅读 · 3月18日

Hyperbolic Multimodal Generative Representation Learning for Generalized Zero-Shot Multimodal Information Extraction

Arxiv

0+阅读 · 3月17日

Graph Neural Networks for Text Classification: A Survey

Arxiv

34+阅读 · 2023年4月27日

相关基金

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

抽样环境下基于流记录的行为特征分析与多分类器识别模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

社会化多媒体中的事件分析研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员