Explainable Task-Oriented Token Communication for AI-Native 6G Networks - 专知论文

会员服务 ·

0

词元分析器 · 传输 · AI · 融合 · 表示 ·

Explainable Task-Oriented Token Communication for AI-Native 6G Networks

翻译：面向AI原生的6G网络的可解释任务导向Token通信

Feibo Jiang,Lei Mao,Li Dong,Kezhi Wang,Cunhua Pan,Jiangzhou Wang

The integration of Foundation Models (FMs) and wireless communications is driving the evolution of image communication from bit-accurate transmission toward task-oriented transmission. However, existing task-oriented image communication methods still face three major challenges: insufficient task-oriented Token representation, inadequate collaboration between Visual Tokens and Task Tokens, and limited interpretability of task decisions. To address these challenges, we propose an Explainable Task-Oriented Token Communication (ET-TokenCom) framework. By treating Tokens as unified units for information representation and transmission, the proposed framework constructs an end-to-end communication link that spans visual perception, wireless transmission, and task reasoning. At the transmitter, the ET-TokenCom framework extracts Visual Tokens from images to preserve low-level visual information. Meanwhile, Task Tokens generated by the FM are introduced to represent the target information and decision intent required by the current task. A Cross-Modal Attention (CMA) fusion mechanism is further designed, enabling Task Tokens to explicitly guide the selection, weighting, and transmission of Visual Tokens. At the receiver, the framework integrates Token decoding with an explainable output mechanism, where attention heatmaps are generated to highlight critical perceptual regions under different task objectives and reveal the influence of Task Tokens on the outputs. Finally, simulation results validate the effectiveness and robustness of the proposed ET-TokenCom framework.

翻译：基础模型（FMs）与无线通信的融合正推动图像通信从比特精确传输向任务导向传输演进。然而，现有任务导向图像通信方法仍面临三大挑战：任务导向Token表示不足、视觉Token与任务Token协作不充分、以及任务决策的可解释性有限。为解决这些问题，我们提出可解释任务导向Token通信（ET-TokenCom）框架。该框架以Token作为信息表示与传输的统一单元，构建跨越视觉感知、无线传输和任务推理的端到端通信链路。在发送端，ET-TokenCom框架从图像中提取视觉Token以保留低层视觉信息，同时引入由基础模型生成的任务Token表征当前任务所需的目标信息与决策意图。进一步设计跨模态注意力（CMA）融合机制，使任务Token能够显式指导视觉Token的选择、加权与传输。在接收端，该框架将Token解码与可解释输出机制结合，通过生成注意力热图突出不同任务目标下的关键感知区域，并揭示任务Token对输出的影响。最后，仿真结果验证了所提ET-TokenCom框架的有效性与鲁棒性。

0

相关内容

词元分析器

词元分析器

《以任务为中心的建模未来：将集成数字成熟度路径与用户故事框架融入任务工程》最新文献

《以任务为中心的建模未来：将集成数字成熟度路径与用户故事框架融入任务工程》最新文献

专知会员服务

30+阅读 · 2025年10月2日

6G网络内生AI技术白皮书（1.0）

6G网络内生AI技术白皮书（1.0）

专知会员服务

31+阅读 · 2024年10月10日

当大型语言模型智能体与6G网络相遇：感知、基准和对齐

当大型语言模型智能体与6G网络相遇：感知、基准和对齐

专知会员服务

54+阅读 · 2024年2月4日

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

专知会员服务

30+阅读 · 2022年6月16日

6G 网络原生 AI 技术需求白皮书

6G 网络原生 AI 技术需求白皮书

专知会员服务

34+阅读 · 2022年5月18日

6G网络 AI 概念术语白皮书

6G网络 AI 概念术语白皮书

专知会员服务

38+阅读 · 2022年5月18日

挖掘图神经网络与矩阵分解之间的关系，56页ppt

专知会员服务

28+阅读 · 2021年9月4日

TAMU发布《图神经网络可解释》综述论文，14页pdf阐述实例级与模型级解释

TAMU发布《图神经网络可解释》综述论文，14页pdf阐述实例级与模型级解释

专知会员服务

87+阅读 · 2021年1月16日

【清华大学】面向任务的对话系统的最新进展和挑战，Task-oriented Dialog System

【清华大学】面向任务的对话系统的最新进展和挑战，Task-oriented Dialog System

专知会员服务

84+阅读 · 2020年3月24日

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

专知会员服务

40+阅读 · 2019年12月5日

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

专知

13+阅读 · 2022年8月11日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

如何构建「可信任的深度学习」？美国三院院士UCLA数学泰斗Stanley Osher教授这44页ppt为你讲述

如何构建「可信任的深度学习」？美国三院院士UCLA数学泰斗Stanley Osher教授这44页ppt为你讲述

专知

13+阅读 · 2020年3月14日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

深度神经网络可解释性方法汇总（附TF代码实现）

深度神经网络可解释性方法汇总（附TF代码实现）

CVer

11+阅读 · 2019年11月4日

基于RASA的task-orient对话系统解析（一）

基于RASA的task-orient对话系统解析（一）

AINLP

16+阅读 · 2019年8月27日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

神经网络可解释性最新进展

神经网络可解释性最新进展

专知

18+阅读 · 2018年3月10日

分层异构网络面向视频流的绿色节能通信研究

国家自然科学基金

6+阅读 · 2015年12月31日

海上认知无线通信系统非授权频谱感知与资源分配算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

群智感知中基于可信交互的细粒度众包机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

移动社会网络的动态社区发现及其信任评价机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

可信工业控制系统中信任冷启动方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

TrustedARI: Towards Trust-Native Agentic Routing Infrastructure for Agentic AI

Arxiv

0+阅读 · 6月14日

Generative Explainability for Next-Generation Networks: LLM-Augmented XAI with Mutual Feature Interactions

Arxiv

0+阅读 · 6月9日

FMplex: Model Virtualization for Serving Extensible Foundation Models

Arxiv

0+阅读 · 6月8日

Semantic and Task-Oriented V2X Communications: Pushing the Limits of V2X Networks Scalability

Arxiv

0+阅读 · 6月8日

Toward Reliable Semantic Communication: Beyond Average Performance

Arxiv

0+阅读 · 5月31日

Recursive Vision Transformer with Dynamic Depth and Width Adjustment for Resource-Efficient Image Semantic Communication

Arxiv

0+阅读 · 5月27日

Toward Goal-Oriented Communication in Multi-Agent Systems: An overview

Arxiv

0+阅读 · 5月21日

Perception-Aware Video Semantic Communication

Arxiv

0+阅读 · 5月19日

VideoSeeker: Incentivizing Instance-level Video Understanding via Native Agentic Tool Invocation

Arxiv

0+阅读 · 5月15日

Generative AI Meets 6G and Beyond: Diffusion Models for Semantic Communications

Arxiv

0+阅读 · 5月7日

VIP会员

文章信息

相关主题

词元分析器

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

6+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

5+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

5+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

4+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

6+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

6+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

3+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

5+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

5+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

4+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

3+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

8+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

6+阅读 · 6月16日

相关VIP内容

《以任务为中心的建模未来：将集成数字成熟度路径与用户故事框架融入任务工程》最新文献

《以任务为中心的建模未来：将集成数字成熟度路径与用户故事框架融入任务工程》最新文献

专知会员服务

30+阅读 · 2025年10月2日

6G网络内生AI技术白皮书（1.0）

6G网络内生AI技术白皮书（1.0）

专知会员服务

31+阅读 · 2024年10月10日

当大型语言模型智能体与6G网络相遇：感知、基准和对齐

当大型语言模型智能体与6G网络相遇：感知、基准和对齐

专知会员服务

54+阅读 · 2024年2月4日

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

专知会员服务

30+阅读 · 2022年6月16日

6G 网络原生 AI 技术需求白皮书

6G 网络原生 AI 技术需求白皮书

专知会员服务

34+阅读 · 2022年5月18日

6G网络 AI 概念术语白皮书

6G网络 AI 概念术语白皮书

专知会员服务

38+阅读 · 2022年5月18日

挖掘图神经网络与矩阵分解之间的关系，56页ppt

专知会员服务

28+阅读 · 2021年9月4日

TAMU发布《图神经网络可解释》综述论文，14页pdf阐述实例级与模型级解释

TAMU发布《图神经网络可解释》综述论文，14页pdf阐述实例级与模型级解释

专知会员服务

87+阅读 · 2021年1月16日

【清华大学】面向任务的对话系统的最新进展和挑战，Task-oriented Dialog System

【清华大学】面向任务的对话系统的最新进展和挑战，Task-oriented Dialog System

专知会员服务

84+阅读 · 2020年3月24日

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

专知会员服务

40+阅读 · 2019年12月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

相关资讯

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

专知

13+阅读 · 2022年8月11日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

如何构建「可信任的深度学习」？美国三院院士UCLA数学泰斗Stanley Osher教授这44页ppt为你讲述

如何构建「可信任的深度学习」？美国三院院士UCLA数学泰斗Stanley Osher教授这44页ppt为你讲述

专知

13+阅读 · 2020年3月14日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

深度神经网络可解释性方法汇总（附TF代码实现）

深度神经网络可解释性方法汇总（附TF代码实现）

CVer

11+阅读 · 2019年11月4日

基于RASA的task-orient对话系统解析（一）

基于RASA的task-orient对话系统解析（一）

AINLP

16+阅读 · 2019年8月27日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

神经网络可解释性最新进展

神经网络可解释性最新进展

专知

18+阅读 · 2018年3月10日

相关论文

TrustedARI: Towards Trust-Native Agentic Routing Infrastructure for Agentic AI

Arxiv

0+阅读 · 6月14日

Generative Explainability for Next-Generation Networks: LLM-Augmented XAI with Mutual Feature Interactions

Arxiv

0+阅读 · 6月9日

FMplex: Model Virtualization for Serving Extensible Foundation Models

Arxiv

0+阅读 · 6月8日

Semantic and Task-Oriented V2X Communications: Pushing the Limits of V2X Networks Scalability

Arxiv

0+阅读 · 6月8日

Toward Reliable Semantic Communication: Beyond Average Performance

Arxiv

0+阅读 · 5月31日

Recursive Vision Transformer with Dynamic Depth and Width Adjustment for Resource-Efficient Image Semantic Communication

Arxiv

0+阅读 · 5月27日

Toward Goal-Oriented Communication in Multi-Agent Systems: An overview

Arxiv

0+阅读 · 5月21日

Perception-Aware Video Semantic Communication

Arxiv

0+阅读 · 5月19日

VideoSeeker: Incentivizing Instance-level Video Understanding via Native Agentic Tool Invocation

Arxiv

0+阅读 · 5月15日

Generative AI Meets 6G and Beyond: Diffusion Models for Semantic Communications

Arxiv

0+阅读 · 5月7日

相关基金

分层异构网络面向视频流的绿色节能通信研究

国家自然科学基金

6+阅读 · 2015年12月31日

海上认知无线通信系统非授权频谱感知与资源分配算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

群智感知中基于可信交互的细粒度众包机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

移动社会网络的动态社区发现及其信任评价机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

可信工业控制系统中信任冷启动方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员