TKG-Thinker: Towards Dynamic Reasoning over Temporal Knowledge Graphs via Agentic Reinforcement Learning - 专知论文

会员服务 ·

0

时序 · 知识 · 图谱 · 时序知识图谱 · 知识图谱 ·

TKG-Thinker: Towards Dynamic Reasoning over Temporal Knowledge Graphs via Agentic Reinforcement Learning

翻译：TKG-Thinker：基于智能体强化学习的时序知识图谱动态推理方法

Zihao Jiang,Miao Peng,Zhenyan Shan,Wenjie Xu,Ben Liu,Gong Chen,Ziqi Gao,Min Peng

Temporal knowledge graph question answering (TKGQA) aims to answer time-sensitive questions by leveraging temporal knowledge bases. While Large Language Models (LLMs) demonstrate significant potential in TKGQA, current prompting strategies constrain their efficacy in two primary ways. First, they are prone to reasoning hallucinations under complex temporal constraints. Second, static prompting limits model autonomy and generalization, as it lack optimization through dynamic interaction with temporal knowledge graphs (TKGs) environments. To address these limitations, we propose \textbf{TKG-Thinker}, a novel agent equipped with autonomous planning and adaptive retrieval capabilities for reasoning over TKGs. Specifically, TKG-Thinker performs in-depth temporal reasoning through dynamic multi-turn interactions with TKGs via a dual-training strategy. We first apply Supervised Fine-Tuning (SFT) with chain-of thought data to instill core planning capabilities, followed by a Reinforcement Learning (RL) stage that leverages multi-dimensional rewards to refine reasoning policies under intricate temporal constraints. Experimental results on benchmark datasets with three open-source LLMs show that TKG-Thinker achieves state-of-the-art performance and exhibits strong generalization across complex TKGQA settings.

翻译：时序知识图谱问答旨在利用时序知识库回答时间敏感性问题。尽管大型语言模型在时序知识图谱问答中展现出巨大潜力，但当前的提示策略主要在两方面限制了其效能。首先，在复杂的时序约束下，模型容易产生推理幻觉。其次，静态提示限制了模型的自主性和泛化能力，因为它缺乏通过与时序知识图谱环境的动态交互进行优化的过程。为应对这些局限，我们提出了\textbf{TKG-Thinker}——一种具备自主规划与自适应检索能力、专为时序知识图谱推理设计的新型智能体。具体而言，TKG-Thinker通过双阶段训练策略，在与时序知识图谱的动态多轮交互中进行深度时序推理。我们首先使用思维链数据进行监督微调，以注入核心规划能力；随后通过强化学习阶段，利用多维奖励在复杂时序约束下优化推理策略。在三个开源大型语言模型及基准数据集上的实验结果表明，TKG-Thinker取得了最先进的性能，并在复杂的时序知识图谱问答场景中展现出强大的泛化能力。

0

相关内容

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

专知会员服务

17+阅读 · 2025年12月10日

从感知到推理：深度思考赋能多模态大语言模型

从感知到推理：深度思考赋能多模态大语言模型

专知会员服务

25+阅读 · 2025年11月19日

决策智能中的时间序列预测大模型

决策智能中的时间序列预测大模型

专知会员服务

32+阅读 · 2025年5月8日

基于大语言模型的时序知识图谱推理模型蒸馏方法

基于大语言模型的时序知识图谱推理模型蒸馏方法

专知会员服务

37+阅读 · 2025年1月10日

时序知识图谱表示与推理的研究进展与趋势

时序知识图谱表示与推理的研究进展与趋势

专知会员服务

33+阅读 · 2024年10月14日

知识图谱如何时序建模？北工大等最新《时态知识图谱》综述，详述TKG的分类、进展与前景

知识图谱如何时序建模？北工大等最新《时态知识图谱》综述，详述TKG的分类、进展与前景

专知会员服务

37+阅读 · 2023年8月8日

时态知识图谱的推理研究综述

时态知识图谱的推理研究综述

专知会员服务

70+阅读 · 2023年6月10日

【AAAI2023】基于历史对比学习的时序知识图谱推理

【AAAI2023】基于历史对比学习的时序知识图谱推理

专知会员服务

35+阅读 · 2022年11月23日

时序知识图谱表示学习

时序知识图谱表示学习

专知会员服务

154+阅读 · 2022年9月17日

【AAAI2022】TLogic:时序知识图谱上可解释链接预测的时间逻辑规则

【AAAI2022】TLogic:时序知识图谱上可解释链接预测的时间逻辑规则

专知会员服务

58+阅读 · 2021年12月16日

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

【SIGIR2020-清华】知识图谱上的增强推荐推理

【SIGIR2020-清华】知识图谱上的增强推荐推理

专知

15+阅读 · 2020年5月30日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

【论文笔记】用于推荐的知识图注意力网络—KGAT

【论文笔记】用于推荐的知识图注意力网络—KGAT

专知

55+阅读 · 2019年10月21日

如何独立实现一个基于知识图谱的问答系统

如何独立实现一个基于知识图谱的问答系统

PaperWeekly

11+阅读 · 2019年6月13日

如何将知识图谱特征学习应用到推荐系统？

如何将知识图谱特征学习应用到推荐系统？

AI100

16+阅读 · 2018年6月10日

论文浅尝 | 用增强学习进行推理：问答与知识库完善（KBC）

论文浅尝 | 用增强学习进行推理：问答与知识库完善（KBC）

开放知识图谱

21+阅读 · 2018年5月24日

时间卷积网络（TCN）将取代RNN成为NLP预测领域王者

时间卷积网络（TCN）将取代RNN成为NLP预测领域王者

AI前线

11+阅读 · 2018年5月14日

【论文推荐】最新六篇知识图谱相关论文—全局关系嵌入、时序关系提取、对抗学习、远距离关系、时序知识图谱

【论文推荐】最新六篇知识图谱相关论文—全局关系嵌入、时序关系提取、对抗学习、远距离关系、时序知识图谱

专知

23+阅读 · 2018年4月24日

论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG

论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG

开放知识图谱

36+阅读 · 2018年3月30日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

心理与教育测量中项目反应时间数据的统计建模及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

通用时序逻辑表达下的视频时空行为理解研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

Temporal-Aware Heterogeneous Graph Reasoning with Multi-View Fusion for Temporal Question Answering

Arxiv

0+阅读 · 2月23日

SenTSR-Bench: Thinking with Injected Knowledge for Time-Series Reasoning

Arxiv

0+阅读 · 2月23日

Framework of Thoughts: A Foundation Framework for Dynamic and Optimized Reasoning based on Chains, Trees, and Graphs

Arxiv

0+阅读 · 2月18日

TimeOmni-1: Incentivizing Complex Reasoning with Time Series in Large Language Models

Arxiv

0+阅读 · 2月18日

MemoTime: Memory-Augmented Temporal Knowledge Graph Enhanced Large Language Model Reasoning

Arxiv

0+阅读 · 2月16日

LLM-Guided Knowledge Distillation for Temporal Knowledge Graph Reasoning

Arxiv

0+阅读 · 2月16日

InftyThink+: Effective and Efficient Infinite-Horizon Reasoning via Reinforcement Learning

Arxiv

0+阅读 · 2月9日

Time Series Reasoning via Process-Verifiable Thinking Data Synthesis and Scheduling for Tailored LLM Reasoning

Arxiv

0+阅读 · 2月8日

InftyThink+: Effective and Efficient Infinite-Horizon Reasoning via Reinforcement Learning

Arxiv

0+阅读 · 2月6日

Asynchronous Reasoning: Training-Free Interactive Thinking LLMs

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

时序知识图谱

最新内容

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

8+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

6+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

3+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

6+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

2+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

2+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

3+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

2+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

12+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

11+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

9+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

17+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

8+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

10+阅读 · 4月18日

相关VIP内容

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

专知会员服务

17+阅读 · 2025年12月10日

从感知到推理：深度思考赋能多模态大语言模型

从感知到推理：深度思考赋能多模态大语言模型

专知会员服务

25+阅读 · 2025年11月19日

决策智能中的时间序列预测大模型

决策智能中的时间序列预测大模型

专知会员服务

32+阅读 · 2025年5月8日

基于大语言模型的时序知识图谱推理模型蒸馏方法

基于大语言模型的时序知识图谱推理模型蒸馏方法

专知会员服务

37+阅读 · 2025年1月10日

时序知识图谱表示与推理的研究进展与趋势

时序知识图谱表示与推理的研究进展与趋势

专知会员服务

33+阅读 · 2024年10月14日

知识图谱如何时序建模？北工大等最新《时态知识图谱》综述，详述TKG的分类、进展与前景

知识图谱如何时序建模？北工大等最新《时态知识图谱》综述，详述TKG的分类、进展与前景

专知会员服务

37+阅读 · 2023年8月8日

时态知识图谱的推理研究综述

时态知识图谱的推理研究综述

专知会员服务

70+阅读 · 2023年6月10日

【AAAI2023】基于历史对比学习的时序知识图谱推理

【AAAI2023】基于历史对比学习的时序知识图谱推理

专知会员服务

35+阅读 · 2022年11月23日

时序知识图谱表示学习

时序知识图谱表示学习

专知会员服务

154+阅读 · 2022年9月17日

【AAAI2022】TLogic:时序知识图谱上可解释链接预测的时间逻辑规则

【AAAI2022】TLogic:时序知识图谱上可解释链接预测的时间逻辑规则

专知会员服务

58+阅读 · 2021年12月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《高超音速武器：一项再度兴起的技术》120页slides

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

美国当前高超音速导弹发展概述

无人机蜂群建模与仿真方法

相关资讯

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

【SIGIR2020-清华】知识图谱上的增强推荐推理

【SIGIR2020-清华】知识图谱上的增强推荐推理

专知

15+阅读 · 2020年5月30日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

【论文笔记】用于推荐的知识图注意力网络—KGAT

【论文笔记】用于推荐的知识图注意力网络—KGAT

专知

55+阅读 · 2019年10月21日

如何独立实现一个基于知识图谱的问答系统

如何独立实现一个基于知识图谱的问答系统

PaperWeekly

11+阅读 · 2019年6月13日

如何将知识图谱特征学习应用到推荐系统？

如何将知识图谱特征学习应用到推荐系统？

AI100

16+阅读 · 2018年6月10日

论文浅尝 | 用增强学习进行推理：问答与知识库完善（KBC）

论文浅尝 | 用增强学习进行推理：问答与知识库完善（KBC）

开放知识图谱

21+阅读 · 2018年5月24日

时间卷积网络（TCN）将取代RNN成为NLP预测领域王者

时间卷积网络（TCN）将取代RNN成为NLP预测领域王者

AI前线

11+阅读 · 2018年5月14日

【论文推荐】最新六篇知识图谱相关论文—全局关系嵌入、时序关系提取、对抗学习、远距离关系、时序知识图谱

【论文推荐】最新六篇知识图谱相关论文—全局关系嵌入、时序关系提取、对抗学习、远距离关系、时序知识图谱

专知

23+阅读 · 2018年4月24日

论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG

论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG

开放知识图谱

36+阅读 · 2018年3月30日

相关论文

Temporal-Aware Heterogeneous Graph Reasoning with Multi-View Fusion for Temporal Question Answering

Arxiv

0+阅读 · 2月23日

SenTSR-Bench: Thinking with Injected Knowledge for Time-Series Reasoning

Arxiv

0+阅读 · 2月23日

Framework of Thoughts: A Foundation Framework for Dynamic and Optimized Reasoning based on Chains, Trees, and Graphs

Arxiv

0+阅读 · 2月18日

TimeOmni-1: Incentivizing Complex Reasoning with Time Series in Large Language Models

Arxiv

0+阅读 · 2月18日

MemoTime: Memory-Augmented Temporal Knowledge Graph Enhanced Large Language Model Reasoning

Arxiv

0+阅读 · 2月16日

LLM-Guided Knowledge Distillation for Temporal Knowledge Graph Reasoning

Arxiv

0+阅读 · 2月16日

InftyThink+: Effective and Efficient Infinite-Horizon Reasoning via Reinforcement Learning

Arxiv

0+阅读 · 2月9日

Time Series Reasoning via Process-Verifiable Thinking Data Synthesis and Scheduling for Tailored LLM Reasoning

Arxiv

0+阅读 · 2月8日

InftyThink+: Effective and Efficient Infinite-Horizon Reasoning via Reinforcement Learning

Arxiv

0+阅读 · 2月6日

Asynchronous Reasoning: Training-Free Interactive Thinking LLMs

Arxiv

0+阅读 · 2月4日

相关基金

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

心理与教育测量中项目反应时间数据的统计建模及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

通用时序逻辑表达下的视频时空行为理解研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员