Peeking inside the Black-Box: Reinforcement Learning for Explainable and Accurate Relation Extraction - 专知论文

会员服务 ·

0

关系抽取 · 数据集 · 奖励函数 · 强化学习 · 单样本 ·

Peeking inside the Black-Box: Reinforcement Learning for Explainable and Accurate Relation Extraction

翻译：窥探黑箱内部：基于强化学习的可解释且准确的关系抽取

Xinyu Guo,Zhengliang Shi,Minglai Yang,Mahdi Rahimi,Mihai Surdeanu

from arxiv, Working in process

We introduce CogRE, a novel framework for relation extraction (RE), enhancing RE from both accuracy and explainability. The framework has two key components: (i) a reasoning mechanism that formulates relation extraction as a series of text-processing steps inspired by cognitive science, and (ii) an optimization process driven by a novel reinforcement learning (RL) reward function. Our framework introduces relation keywords and rewards generating such keywords using an automatically constructed keywords dictionary. This design addresses the lack of language-based explanations in traditional RE and provides supervision for explanation during RL training. Our experiments show that CogRE improves explanation quality by addressing two common failure patterns in one-shot RE: poor attention focus and limited one-shot learning capability. For example, our cognitive-structured reasoning with Qwen2.5-15B-Instruct on One-shot NYT29 achieves 24.65% F1, surpassing prior reasoning-based designs. Optimizing this approach with RL using our reward further improves performance by +23.46% (absolute). Further, models trained on NYT29 with our reward achieve a +16.9% F1 gain on out-of-distribution WIKIDATA. Finally, human evaluation shows that our best model generates relational keywords closely aligned with gold labels, increasing human explanation quality ratings by 54% (relative).

翻译：我们提出CogRE，一种新颖的关系抽取框架，从准确性和可解释性两方面增强关系抽取。该框架包含两个关键组件：(i) 受认知科学启发的推理机制，将关系抽取形式化为一系列文本处理步骤；(ii) 由新型强化学习奖励函数驱动的优化过程。本框架引入关系关键词，并通过自动构建的关键词词典奖励生成此类关键词。该设计解决了传统关系抽取中缺乏基于语言的解释的问题，并在强化学习训练期间为解释提供监督。实验表明，CogRE通过解决单样本关系抽取中两种常见失效模式——注意力聚焦不良和单样本学习能力有限——提升了解释质量。例如，我们基于Qwen2.5-15B-Instruct的认知结构化推理在One-shot NYT29数据集上达到24.65%的F1值，超越了先前基于推理的设计。使用我们的奖励函数通过强化学习优化该方法，性能进一步提升了+23.46%（绝对值）。此外，在NYT29数据集上使用我们的奖励函数训练的模型，在分布外数据集WIKIDATA上实现了+16.9%的F1增益。最后，人工评估表明，我们的最佳模型生成的关系关键词与黄金标注高度吻合，将人工解释质量评分提升了54%（相对值）。

0

相关内容

关系抽取

关系抽取指的是检测和识别文本中实体之间的语义关系，并将表示同一语义关系的提及（mention）链接起来的任务。关系提取任务需要在一组工件（通常来自文本或XML文档）中对语义关系提及进行检测和分类。该任务与信息抽取（IE）的任务非常相似，但是IE还需要删除重复关系（消除歧义），并且通常指的是提取许多不同的关系。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

「基于深度学习的实体关系联合抽取」研究综述

「基于深度学习的实体关系联合抽取」研究综述

专知会员服务

43+阅读 · 2023年7月5日

【ACL2022】一个用于远距监督关系抽取的层级对比学习框架, HiCLRE: A Hierarchical Contrastive Learning Framework for Distantly Supervised Relation Extraction

【ACL2022】一个用于远距监督关系抽取的层级对比学习框架, HiCLRE: A Hierarchical Contrastive Learning Framework for Distantly Supervised Relation Extraction

专知会员服务

15+阅读 · 2022年3月24日

基于深度学习的事件因果关系抽取综述

专知会员服务

80+阅读 · 2021年5月27日

电子科大最新《基于深度神经网络的关系提取》综述论文，20页pdf

电子科大最新《基于深度神经网络的关系提取》综述论文，20页pdf

专知会员服务

40+阅读 · 2021年1月8日

【CCL2020】基于深度学习的实体关系抽取研究综述

【CCL2020】基于深度学习的实体关系抽取研究综述

专知会员服务

53+阅读 · 2020年11月4日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【清华大学-腾讯】关系提取综述，Review and Outlook for Relation Extraction

【清华大学-腾讯】关系提取综述，Review and Outlook for Relation Extraction

专知会员服务

38+阅读 · 2020年4月8日

【深度学习表格检测、信息提取和结构化】《Table Detection, Information Extraction and Structuring using Deep Learning》by Vihar Kurama

专知会员服务

38+阅读 · 2020年1月23日

【UIUC】基于知识图谱和语料库的协同推理:一个多智能体强化学习方法（Cooperative Reasoning on Knowledge Graph and Corpus: A Multi-agentReinforcement Learning Approach）

【UIUC】基于知识图谱和语料库的协同推理:一个多智能体强化学习方法（Cooperative Reasoning on Knowledge Graph and Corpus: A Multi-agentReinforcement Learning Approach）

专知会员服务

26+阅读 · 2019年12月7日

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

专知会员服务

14+阅读 · 2019年10月25日

远程监督在关系抽取中的应用

远程监督在关系抽取中的应用

深度学习自然语言处理

12+阅读 · 2020年10月26日

【关系抽取】从文本中进行关系抽取的几种不同的方法

【关系抽取】从文本中进行关系抽取的几种不同的方法

深度学习自然语言处理

29+阅读 · 2020年3月30日

OpenNRE 2.0：可一键运行的开源关系抽取工具包

OpenNRE 2.0：可一键运行的开源关系抽取工具包

PaperWeekly

22+阅读 · 2019年10月30日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

AAAI 2019 | 基于分层强化学习的关系抽取

AAAI 2019 | 基于分层强化学习的关系抽取

PaperWeekly

20+阅读 · 2019年3月27日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

大讲堂 | 神经关系抽取模型

大讲堂 | 神经关系抽取模型

AI研习社

24+阅读 · 2018年9月11日

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

专知

17+阅读 · 2018年6月16日

基于图片内容的深度学习图片检索（一）

基于图片内容的深度学习图片检索（一）

七月在线实验室

20+阅读 · 2017年10月1日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于格值逻辑的语言真值α-群锁语义归结自动推理研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval

Arxiv

0+阅读 · 3月2日

G-reasoner: Foundation Models for Unified Reasoning over Graph-structured Knowledge

Arxiv

0+阅读 · 3月1日

Interact-RAG: Reason and Interact with the Corpus, Beyond Black-Box Retrieval

Arxiv

0+阅读 · 2月26日

The Potential of CoT for Reasoning: A Closer Look at Trace Dynamics

Arxiv

0+阅读 · 2月25日

Efficient Reinforcement Learning for Large Language Models with Intrinsic Exploration

Arxiv

0+阅读 · 2月19日

Lifted Relational Probabilistic Inference via Implicit Learning

Arxiv

0+阅读 · 2月16日

RuleReasoner: Reinforced Rule-based Reasoning via Domain-aware Dynamic Sampling

Arxiv

0+阅读 · 2月15日

Embed-RL: Reinforcement Learning for Reasoning-Driven Multimodal Embeddings

Arxiv

0+阅读 · 2月14日

Compositional Generalization from Learned Skills via CoT Training: A Theoretical and Structural Analysis for Reasoning

Arxiv

0+阅读 · 2月12日

interwhen: A Generalizable Framework for Verifiable Reasoning with Test-time Monitors

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

5+阅读 · 今天8:46

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

3+阅读 · 今天7:41

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

2+阅读 · 今天7:22

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

6+阅读 · 今天6:04

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

8+阅读 · 今天5:37

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

6+阅读 · 今天5:35

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

2+阅读 · 今天5:24

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

专知会员服务

2+阅读 · 今天5:18

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

专知会员服务

2+阅读 · 今天3:25

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

专知会员服务

15+阅读 · 今天2:55

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

3+阅读 · 4月23日

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

4+阅读 · 4月23日

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

4+阅读 · 4月23日

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

7+阅读 · 4月23日

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

3+阅读 · 4月23日

相关VIP内容

「基于深度学习的实体关系联合抽取」研究综述

「基于深度学习的实体关系联合抽取」研究综述

专知会员服务

43+阅读 · 2023年7月5日

【ACL2022】一个用于远距监督关系抽取的层级对比学习框架, HiCLRE: A Hierarchical Contrastive Learning Framework for Distantly Supervised Relation Extraction

【ACL2022】一个用于远距监督关系抽取的层级对比学习框架, HiCLRE: A Hierarchical Contrastive Learning Framework for Distantly Supervised Relation Extraction

专知会员服务

15+阅读 · 2022年3月24日

基于深度学习的事件因果关系抽取综述

专知会员服务

80+阅读 · 2021年5月27日

电子科大最新《基于深度神经网络的关系提取》综述论文，20页pdf

电子科大最新《基于深度神经网络的关系提取》综述论文，20页pdf

专知会员服务

40+阅读 · 2021年1月8日

【CCL2020】基于深度学习的实体关系抽取研究综述

【CCL2020】基于深度学习的实体关系抽取研究综述

专知会员服务

53+阅读 · 2020年11月4日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【清华大学-腾讯】关系提取综述，Review and Outlook for Relation Extraction

【清华大学-腾讯】关系提取综述，Review and Outlook for Relation Extraction

专知会员服务

38+阅读 · 2020年4月8日

【深度学习表格检测、信息提取和结构化】《Table Detection, Information Extraction and Structuring using Deep Learning》by Vihar Kurama

专知会员服务

38+阅读 · 2020年1月23日

【UIUC】基于知识图谱和语料库的协同推理:一个多智能体强化学习方法（Cooperative Reasoning on Knowledge Graph and Corpus: A Multi-agentReinforcement Learning Approach）

【UIUC】基于知识图谱和语料库的协同推理:一个多智能体强化学习方法（Cooperative Reasoning on Knowledge Graph and Corpus: A Multi-agentReinforcement Learning Approach）

专知会员服务

26+阅读 · 2019年12月7日

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

专知会员服务

14+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

战场之外的较量：美伊冲突中的认知战与心理博弈

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

以色列军事技术对美国军力发展的持续性赋能

俄乌战争中乌克兰防空能力演变与见解（中文版）

相关资讯

远程监督在关系抽取中的应用

远程监督在关系抽取中的应用

深度学习自然语言处理

12+阅读 · 2020年10月26日

【关系抽取】从文本中进行关系抽取的几种不同的方法

【关系抽取】从文本中进行关系抽取的几种不同的方法

深度学习自然语言处理

29+阅读 · 2020年3月30日

OpenNRE 2.0：可一键运行的开源关系抽取工具包

OpenNRE 2.0：可一键运行的开源关系抽取工具包

PaperWeekly

22+阅读 · 2019年10月30日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

AAAI 2019 | 基于分层强化学习的关系抽取

AAAI 2019 | 基于分层强化学习的关系抽取

PaperWeekly

20+阅读 · 2019年3月27日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

大讲堂 | 神经关系抽取模型

大讲堂 | 神经关系抽取模型

AI研习社

24+阅读 · 2018年9月11日

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

专知

17+阅读 · 2018年6月16日

基于图片内容的深度学习图片检索（一）

基于图片内容的深度学习图片检索（一）

七月在线实验室

20+阅读 · 2017年10月1日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

相关论文

LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval

Arxiv

0+阅读 · 3月2日

G-reasoner: Foundation Models for Unified Reasoning over Graph-structured Knowledge

Arxiv

0+阅读 · 3月1日

Interact-RAG: Reason and Interact with the Corpus, Beyond Black-Box Retrieval

Arxiv

0+阅读 · 2月26日

The Potential of CoT for Reasoning: A Closer Look at Trace Dynamics

Arxiv

0+阅读 · 2月25日

Efficient Reinforcement Learning for Large Language Models with Intrinsic Exploration

Arxiv

0+阅读 · 2月19日

Lifted Relational Probabilistic Inference via Implicit Learning

Arxiv

0+阅读 · 2月16日

RuleReasoner: Reinforced Rule-based Reasoning via Domain-aware Dynamic Sampling

Arxiv

0+阅读 · 2月15日

Embed-RL: Reinforcement Learning for Reasoning-Driven Multimodal Embeddings

Arxiv

0+阅读 · 2月14日

Compositional Generalization from Learned Skills via CoT Training: A Theoretical and Structural Analysis for Reasoning

Arxiv

0+阅读 · 2月12日

interwhen: A Generalizable Framework for Verifiable Reasoning with Test-time Monitors

Arxiv

0+阅读 · 2月5日

相关基金

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于格值逻辑的语言真值α-群锁语义归结自动推理研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员