6GAgentGym: Tool Use, Data Synthesis, and Agentic Learning for Network Management - 专知论文

会员服务 ·

0

工具 · 交互 · 合成 · 工具使用 · 6G ·

6GAgentGym: Tool Use, Data Synthesis, and Agentic Learning for Network Management

翻译：6GAgentGym：面向网络管理的工具使用、数据合成与智能体学习

Jiao Chen,Jianhua Tang,Xiaotong Yang,Zuohong Lv

Autonomous 6G network management requires agents that can execute tools, observe the resulting state changes, and adapt their decisions accordingly. Existing benchmarks based on static questions or scripted episode replay, however, do not support such closed-loop interaction, limiting agents to passive evaluation without the ability to learn from environmental feedback. This paper presents 6GAgentGym to provide closed-loop capability. The framework provides an interactive environment with 42 typed tools whose effect classification distinguishes read-only observation from state-mutating configuration, backed by a learned Experiment Model calibrated on NS-3 simulation data. 6G-Forge bootstraps closed-loop training trajectories from NS-3 seeds via iterative Self-Instruct generation with execution verification against the Experiment Model. Supervised fine-tuning on the resulting corpus followed by reinforcement learning with online closed-loop interaction enables an 8B open-source model to achieve comparable overall success rate to GPT-5 on the accompanying 6GAgentBench, with stronger performance on long-horizon tasks. Together, these components provide a viable path toward autonomous, closed-loop network management.

翻译：自主6G网络管理需要能够执行工具、观察结果状态变化并相应调整决策的智能体。然而，现有基于静态问题或脚本化场景回放的基准测试无法支持此类闭环交互，限制了智能体只能进行被动评估，而无法从环境反馈中学习。本文提出6GAgentGym以提供闭环能力。该框架提供了一个包含42种类型化工具的交互环境，其效果分类将纯观测与状态改变配置加以区分，并由基于NS-3仿真数据校准的学习型实验模型（Experiment Model）支撑。6G-Forge通过迭代式自指令生成（Self-Instruct）结合实验模型执行验证，从NS-3种子数据引导出闭环训练轨迹。对生成语料库进行监督微调，再结合在线闭环交互的强化学习，使得一个8B开源模型在配套的6GAgentBench上实现了与GPT-5相当的整体成功率，并在长周期任务上展现出更强性能。这些组件共同为迈向自主闭环网络管理提供了可行路径。

0

相关内容

《支持 ML/AI 的下一代智能自主网络系统：性能提升与管理》177页

《支持 ML/AI 的下一代智能自主网络系统：性能提升与管理》177页

专知会员服务

42+阅读 · 2024年11月22日

6G网络内生AI技术白皮书（1.0）

6G网络内生AI技术白皮书（1.0）

专知会员服务

31+阅读 · 2024年10月10日

当大型语言模型智能体与6G网络相遇：感知、基准和对齐

当大型语言模型智能体与6G网络相遇：感知、基准和对齐

专知会员服务

54+阅读 · 2024年2月4日

《基于云网融合的6G关键技术白皮书》中国电信研究院与紫金山实验室

《基于云网融合的6G关键技术白皮书》中国电信研究院与紫金山实验室

专知会员服务

26+阅读 · 2022年8月30日

AI-6G与元宇宙？爱尔兰东理最新《人工智能和6G与元宇宙:基本原理、挑战和未来研究趋势》综述，39页pdf涵盖263篇文献

AI-6G与元宇宙？爱尔兰东理最新《人工智能和6G与元宇宙:基本原理、挑战和未来研究趋势》综述，39页pdf涵盖263篇文献

专知会员服务

60+阅读 · 2022年8月25日

B5G/6G网络智能数据分析：网络数据采集、知识表示与推理、特征数据集构建与评估

B5G/6G网络智能数据分析：网络数据采集、知识表示与推理、特征数据集构建与评估

专知会员服务

35+阅读 · 2022年5月18日

6G 网络原生 AI 技术需求白皮书

6G 网络原生 AI 技术需求白皮书

专知会员服务

34+阅读 · 2022年5月18日

6G网络 AI 概念术语白皮书

6G网络 AI 概念术语白皮书

专知会员服务

38+阅读 · 2022年5月18日

《6G总体白皮书》未来移动通信论坛

《6G总体白皮书》未来移动通信论坛

专知会员服务

42+阅读 · 2022年4月15日

【AI/ML+6G】22页pdf为你解读AI/ML如何助力6G发展？（附报告）

【AI/ML+6G】22页pdf为你解读AI/ML如何助力6G发展？（附报告）

专知会员服务

39+阅读 · 2022年3月15日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

6G全球进展与发展展望白皮书，35页pdf

6G全球进展与发展展望白皮书，35页pdf

专知

20+阅读 · 2021年5月8日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

机器之心

15+阅读 · 2018年3月11日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

支持智能终端通信的物联网管控机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向动态演化的网构软件失效机理与测评方法

国家自然科学基金

1+阅读 · 2015年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向用户体验的无线异构软件定义网络资源管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于超云平台的社会化移动网络大数据管理与分析关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

Tool Use as Action: Towards Agentic Control in Mobile Core Networks

Tool Use as Action: Towards Agentic Control in Mobile Core Networks

Arxiv

0+阅读 · 5月4日

LLM-Based Agentic Negotiation for 6G: Addressing Uncertainty Neglect and Tail-Event Risk

Arxiv

0+阅读 · 4月30日

Reflection-Driven Self-Optimization 6G Agentic AI RAN via Simulation-in-the-Loop Workflows

Arxiv

0+阅读 · 4月21日

SEAL: An Open, Auditable, and Fair Data Generation Framework for AI-Native 6G Networks

Arxiv

0+阅读 · 4月2日

Goal-Oriented Multi-Agent Semantic Networking: Unifying Intents, Semantics, and Intelligence

Arxiv

0+阅读 · 3月24日

A Tutorial on Cognitive Biases in Agentic AI-Driven 6G Autonomous Networks

Arxiv

0+阅读 · 3月13日

Semantic-Aware 6G Network Management through Knowledge-Defined Networking

Arxiv

0+阅读 · 3月13日

Intelligent 6G Edge Connectivity: A Knowledge Driven Optimization Framework for Small Cell Selection

Arxiv

0+阅读 · 3月12日

The Network That Thinks: Kraken* and the Dawn of Cognitive 6G

Arxiv

0+阅读 · 3月12日

Reasoning-Native Agentic Communication for 6G

Arxiv

0+阅读 · 2月19日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

3+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

2+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

2+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

13+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

《支持 ML/AI 的下一代智能自主网络系统：性能提升与管理》177页

《支持 ML/AI 的下一代智能自主网络系统：性能提升与管理》177页

专知会员服务

42+阅读 · 2024年11月22日

6G网络内生AI技术白皮书（1.0）

6G网络内生AI技术白皮书（1.0）

专知会员服务

31+阅读 · 2024年10月10日

当大型语言模型智能体与6G网络相遇：感知、基准和对齐

当大型语言模型智能体与6G网络相遇：感知、基准和对齐

专知会员服务

54+阅读 · 2024年2月4日

《基于云网融合的6G关键技术白皮书》中国电信研究院与紫金山实验室

《基于云网融合的6G关键技术白皮书》中国电信研究院与紫金山实验室

专知会员服务

26+阅读 · 2022年8月30日

AI-6G与元宇宙？爱尔兰东理最新《人工智能和6G与元宇宙:基本原理、挑战和未来研究趋势》综述，39页pdf涵盖263篇文献

AI-6G与元宇宙？爱尔兰东理最新《人工智能和6G与元宇宙:基本原理、挑战和未来研究趋势》综述，39页pdf涵盖263篇文献

专知会员服务

60+阅读 · 2022年8月25日

B5G/6G网络智能数据分析：网络数据采集、知识表示与推理、特征数据集构建与评估

B5G/6G网络智能数据分析：网络数据采集、知识表示与推理、特征数据集构建与评估

专知会员服务

35+阅读 · 2022年5月18日

6G 网络原生 AI 技术需求白皮书

6G 网络原生 AI 技术需求白皮书

专知会员服务

34+阅读 · 2022年5月18日

6G网络 AI 概念术语白皮书

6G网络 AI 概念术语白皮书

专知会员服务

38+阅读 · 2022年5月18日

《6G总体白皮书》未来移动通信论坛

《6G总体白皮书》未来移动通信论坛

专知会员服务

42+阅读 · 2022年4月15日

【AI/ML+6G】22页pdf为你解读AI/ML如何助力6G发展？（附报告）

【AI/ML+6G】22页pdf为你解读AI/ML如何助力6G发展？（附报告）

专知会员服务

39+阅读 · 2022年3月15日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

6G全球进展与发展展望白皮书，35页pdf

6G全球进展与发展展望白皮书，35页pdf

专知

20+阅读 · 2021年5月8日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

机器之心

15+阅读 · 2018年3月11日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

相关论文

Tool Use as Action: Towards Agentic Control in Mobile Core Networks

Tool Use as Action: Towards Agentic Control in Mobile Core Networks

Arxiv

0+阅读 · 5月4日

LLM-Based Agentic Negotiation for 6G: Addressing Uncertainty Neglect and Tail-Event Risk

Arxiv

0+阅读 · 4月30日

Reflection-Driven Self-Optimization 6G Agentic AI RAN via Simulation-in-the-Loop Workflows

Arxiv

0+阅读 · 4月21日

SEAL: An Open, Auditable, and Fair Data Generation Framework for AI-Native 6G Networks

Arxiv

0+阅读 · 4月2日

Goal-Oriented Multi-Agent Semantic Networking: Unifying Intents, Semantics, and Intelligence

Arxiv

0+阅读 · 3月24日

A Tutorial on Cognitive Biases in Agentic AI-Driven 6G Autonomous Networks

Arxiv

0+阅读 · 3月13日

Semantic-Aware 6G Network Management through Knowledge-Defined Networking

Arxiv

0+阅读 · 3月13日

Intelligent 6G Edge Connectivity: A Knowledge Driven Optimization Framework for Small Cell Selection

Arxiv

0+阅读 · 3月12日

The Network That Thinks: Kraken* and the Dawn of Cognitive 6G

Arxiv

0+阅读 · 3月12日

Reasoning-Native Agentic Communication for 6G

Arxiv

0+阅读 · 2月19日

相关基金

支持智能终端通信的物联网管控机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向动态演化的网构软件失效机理与测评方法

国家自然科学基金

1+阅读 · 2015年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向用户体验的无线异构软件定义网络资源管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于超云平台的社会化移动网络大数据管理与分析关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员