TAAF: A Trace Abstraction and Analysis Framework Synergizing Knowledge Graphs and LLMs - 专知论文

会员服务 ·

0

分析 · 知识 · 图谱 · 系统 · 语言模型 ·

TAAF: A Trace Abstraction and Analysis Framework Synergizing Knowledge Graphs and LLMs

翻译：TAAF：融合知识图谱与大型语言模型的轨迹抽象与分析框架

Alireza Ezaz,Ghazal Khodabandeh,Majid Babaei,Naser Ezzati-Jivan

from arxiv, Accepted to ICSE 2026. DOI 10.1145/3744916.3787832

Execution traces are a critical source of information for understanding, debugging, and optimizing complex software systems. However, traces from OS kernels or large-scale applications like Chrome or MySQL are massive and difficult to analyze. Existing tools rely on predefined analyses, and custom insights often require writing domain-specific scripts, which is an error-prone and time-consuming task. This paper introduces TAAF (Trace Abstraction and Analysis Framework), a novel approach that combines time-indexing, knowledge graphs (KGs), and large language models (LLMs) to transform raw trace data into actionable insights. TAAF constructs a time-indexed KG from trace events to capture relationships among entities such as threads, CPUs, and system resources. An LLM then interprets query-specific subgraphs to answer natural-language questions, reducing the need for manual inspection and deep system expertise. To evaluate TAAF, we introduce TraceQA-100, a benchmark of 100 questions grounded in real kernel traces. Experiments across three LLMs and multiple temporal settings show that TAAF improves answer accuracy by up to 31.2%, particularly in multi-hop and causal reasoning tasks. We further analyze where graph-grounded reasoning helps and where limitations remain, offering a foundation for next-generation trace analysis tools.

翻译：执行轨迹是理解、调试和优化复杂软件系统的关键信息来源。然而，来自操作系统内核或大规模应用程序（如Chrome或MySQL）的轨迹数据量巨大且难以分析。现有工具依赖于预定义的分析方法，而获取定制化洞察通常需要编写领域特定脚本，这是一项易出错且耗时的任务。本文介绍了TAAF（轨迹抽象与分析框架），这是一种结合时间索引、知识图谱和大型语言模型的新方法，旨在将原始轨迹数据转化为可操作的洞察。TAAF从轨迹事件构建时间索引的知识图谱，以捕获线程、CPU和系统资源等实体之间的关系。随后，大型语言模型通过解释查询特定的子图来回答自然语言问题，从而减少人工检查的需求并降低对深度系统专业知识的要求。为评估TAAF，我们提出了TraceQA-100基准测试，包含基于真实内核轨迹的100个问题。在三种大型语言模型和多种时间设置下的实验表明，TAAF将答案准确率最高提升了31.2%，尤其在多跳推理和因果推理任务中表现突出。我们进一步分析了基于图谱的推理在哪些场景中有效以及仍存在哪些局限性，为下一代轨迹分析工具奠定了基础。

0

相关内容

自动驾驶中的轨迹预测大型基础模型：全面综述

自动驾驶中的轨迹预测大型基础模型：全面综述

专知会员服务

16+阅读 · 2025年9月18日

基于大语言模型的知识图谱逻辑规则挖掘框架及应用

基于大语言模型的知识图谱逻辑规则挖掘框架及应用

专知会员服务

27+阅读 · 2025年5月22日

【KDD2024】LogParser-LLM：利用大型语言模型推动高效日志解析

【KDD2024】LogParser-LLM：利用大型语言模型推动高效日志解析

专知会员服务

27+阅读 · 2024年9月5日

「深度学习在轨迹数据管理与挖掘的应用」最新综述及其展望

「深度学习在轨迹数据管理与挖掘的应用」最新综述及其展望

专知会员服务

25+阅读 · 2024年3月23日

大模型如何重塑检索？人大最新《大型语言模型在信息检索中的应用》综述，26页pdf详述大模型+检索技术

大模型如何重塑检索？人大最新《大型语言模型在信息检索中的应用》综述，26页pdf详述大模型+检索技术

专知会员服务

94+阅读 · 2023年8月16日

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

专知会员服务

193+阅读 · 2023年6月19日

不可错过！斯坦福大学《知识图谱》课程，Jure等业界顶尖大牛讲述知识图谱技术进展，附PPT下载

不可错过！斯坦福大学《知识图谱》课程，Jure等业界顶尖大牛讲述知识图谱技术进展，附PPT下载

专知会员服务

91+阅读 · 2020年6月18日

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

专知会员服务

49+阅读 · 2020年5月26日

【纽约大学】轨迹数据管理、分析和学习的综述，36页pdf，Trajectory Data Analytics

【纽约大学】轨迹数据管理、分析和学习的综述，36页pdf，Trajectory Data Analytics

专知会员服务

40+阅读 · 2020年3月27日

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

专知会员服务

74+阅读 · 2019年11月20日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

如何构建行业知识图谱（以医疗行业为例）

如何构建行业知识图谱（以医疗行业为例）

专知

31+阅读 · 2019年11月7日

如何构建行业知识图谱（以电影行业为例）

如何构建行业知识图谱（以电影行业为例）

AINLP

55+阅读 · 2019年10月9日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

腾讯互娱刘伟 | 知识图谱在运维中的应用

腾讯互娱刘伟 | 知识图谱在运维中的应用

开放知识图谱

20+阅读 · 2018年10月10日

【知识图谱】一个有效的知识图谱是如何构建的？

【知识图谱】一个有效的知识图谱是如何构建的？

产业智能官

57+阅读 · 2018年4月5日

tensorflow系列笔记：流程，概念和代码解析

tensorflow系列笔记：流程，概念和代码解析

北京思腾合力科技有限公司

30+阅读 · 2017年11月11日

大规模知识图谱的构建、推理及应用

大规模知识图谱的构建、推理及应用

人工智能头条

15+阅读 · 2017年8月29日

干货 | 大规模知识图谱的构建、推理及应用

干货 | 大规模知识图谱的构建、推理及应用

机器学习研究会

11+阅读 · 2017年8月28日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

面向空中智能交通的大规模飞行航迹处理与分析方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

量质融合的移动轨迹相似性查询技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于粒计算的大数据特征融合理论与方法

国家自然科学基金

8+阅读 · 2015年12月31日

基于轨迹压缩的城市交通拥堵识别与跟踪研究

国家自然科学基金

0+阅读 · 2015年12月31日

大规模轨迹数据的地理空间关联解译及分析挖掘研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

行为轨迹数据高性能时空聚类及社会分析

国家自然科学基金

2+阅读 · 2014年12月31日

STELLAR: Structure-guided LLM Assertion Retrieval and Generation for Formal Verification

Arxiv

0+阅读 · 2月5日

UniSage: A Unified and Post-Analysis-Aware Sampling for Microservices

Arxiv

0+阅读 · 2月4日

Functional-SVD for Heterogeneous Trajectories: Case Studies in Health

Arxiv

0+阅读 · 2月3日

PlanTRansformer: Unified Prediction and Planning with Goal-conditioned Transformer

Arxiv

0+阅读 · 2月3日

Trajectory Data Management and Mining: A Survey from Deep Learning to the LLM Era

Arxiv

0+阅读 · 1月31日

DataCross: A Unified Benchmark and Agent Framework for Cross-Modal Heterogeneous Data Analysis

Arxiv

0+阅读 · 1月29日

ConStruM: A Structure-Guided LLM Framework for Context-Aware Schema Matching

Arxiv

0+阅读 · 1月28日

TransMode-LLM: Feature-Informed Natural Language Modeling with Domain-Enhanced Prompting for Travel Behavior Modeling

Arxiv

0+阅读 · 1月20日

STELLAR: A Search-Based Testing Framework for Large Language Model Applications

Arxiv

0+阅读 · 1月5日

A Training-Free Large Reasoning Model-based Knowledge Tracing Framework for Unified Prediction and Prescription

Arxiv

0+阅读 · 1月5日

VIP会员

文章信息

相关主题

最新内容

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

2+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

3+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

10+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

7+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

6+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

4+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

10+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

6+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

9+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

11+阅读 · 7月26日

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

专知会员服务

8+阅读 · 7月26日

《反无人机交战场景下的战斗归零研究》

《反无人机交战场景下的战斗归零研究》

专知会员服务

7+阅读 · 7月26日

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

专知会员服务

4+阅读 · 7月26日

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

6+阅读 · 7月25日

相关VIP内容

自动驾驶中的轨迹预测大型基础模型：全面综述

自动驾驶中的轨迹预测大型基础模型：全面综述

专知会员服务

16+阅读 · 2025年9月18日

基于大语言模型的知识图谱逻辑规则挖掘框架及应用

基于大语言模型的知识图谱逻辑规则挖掘框架及应用

专知会员服务

27+阅读 · 2025年5月22日

【KDD2024】LogParser-LLM：利用大型语言模型推动高效日志解析

【KDD2024】LogParser-LLM：利用大型语言模型推动高效日志解析

专知会员服务

27+阅读 · 2024年9月5日

「深度学习在轨迹数据管理与挖掘的应用」最新综述及其展望

「深度学习在轨迹数据管理与挖掘的应用」最新综述及其展望

专知会员服务

25+阅读 · 2024年3月23日

大模型如何重塑检索？人大最新《大型语言模型在信息检索中的应用》综述，26页pdf详述大模型+检索技术

大模型如何重塑检索？人大最新《大型语言模型在信息检索中的应用》综述，26页pdf详述大模型+检索技术

专知会员服务

94+阅读 · 2023年8月16日

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

专知会员服务

193+阅读 · 2023年6月19日

不可错过！斯坦福大学《知识图谱》课程，Jure等业界顶尖大牛讲述知识图谱技术进展，附PPT下载

不可错过！斯坦福大学《知识图谱》课程，Jure等业界顶尖大牛讲述知识图谱技术进展，附PPT下载

专知会员服务

91+阅读 · 2020年6月18日

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

专知会员服务

49+阅读 · 2020年5月26日

【纽约大学】轨迹数据管理、分析和学习的综述，36页pdf，Trajectory Data Analytics

【纽约大学】轨迹数据管理、分析和学习的综述，36页pdf，Trajectory Data Analytics

专知会员服务

40+阅读 · 2020年3月27日

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

专知会员服务

74+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

美空军新型反无人机部队初探

博士论文 | 面向大模型推理的内存高效算法

《无人系统互操作性导论——无人系统联合架构（JAUS）》

相关资讯

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

如何构建行业知识图谱（以医疗行业为例）

如何构建行业知识图谱（以医疗行业为例）

专知

31+阅读 · 2019年11月7日

如何构建行业知识图谱（以电影行业为例）

如何构建行业知识图谱（以电影行业为例）

AINLP

55+阅读 · 2019年10月9日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

腾讯互娱刘伟 | 知识图谱在运维中的应用

腾讯互娱刘伟 | 知识图谱在运维中的应用

开放知识图谱

20+阅读 · 2018年10月10日

【知识图谱】一个有效的知识图谱是如何构建的？

【知识图谱】一个有效的知识图谱是如何构建的？

产业智能官

57+阅读 · 2018年4月5日

tensorflow系列笔记：流程，概念和代码解析

tensorflow系列笔记：流程，概念和代码解析

北京思腾合力科技有限公司

30+阅读 · 2017年11月11日

大规模知识图谱的构建、推理及应用

大规模知识图谱的构建、推理及应用

人工智能头条

15+阅读 · 2017年8月29日

干货 | 大规模知识图谱的构建、推理及应用

干货 | 大规模知识图谱的构建、推理及应用

机器学习研究会

11+阅读 · 2017年8月28日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

相关论文

STELLAR: Structure-guided LLM Assertion Retrieval and Generation for Formal Verification

Arxiv

0+阅读 · 2月5日

UniSage: A Unified and Post-Analysis-Aware Sampling for Microservices

Arxiv

0+阅读 · 2月4日

Functional-SVD for Heterogeneous Trajectories: Case Studies in Health

Arxiv

0+阅读 · 2月3日

PlanTRansformer: Unified Prediction and Planning with Goal-conditioned Transformer

Arxiv

0+阅读 · 2月3日

Trajectory Data Management and Mining: A Survey from Deep Learning to the LLM Era

Arxiv

0+阅读 · 1月31日

DataCross: A Unified Benchmark and Agent Framework for Cross-Modal Heterogeneous Data Analysis

Arxiv

0+阅读 · 1月29日

ConStruM: A Structure-Guided LLM Framework for Context-Aware Schema Matching

Arxiv

0+阅读 · 1月28日

TransMode-LLM: Feature-Informed Natural Language Modeling with Domain-Enhanced Prompting for Travel Behavior Modeling

Arxiv

0+阅读 · 1月20日

STELLAR: A Search-Based Testing Framework for Large Language Model Applications

Arxiv

0+阅读 · 1月5日

A Training-Free Large Reasoning Model-based Knowledge Tracing Framework for Unified Prediction and Prescription

Arxiv

0+阅读 · 1月5日

相关基金

面向空中智能交通的大规模飞行航迹处理与分析方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

量质融合的移动轨迹相似性查询技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于粒计算的大数据特征融合理论与方法

国家自然科学基金

8+阅读 · 2015年12月31日

基于轨迹压缩的城市交通拥堵识别与跟踪研究

国家自然科学基金

0+阅读 · 2015年12月31日

大规模轨迹数据的地理空间关联解译及分析挖掘研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

行为轨迹数据高性能时空聚类及社会分析

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员