Incentive-Aligned Vehicle-to-Vehicle Energy Trading via Nash-Integrated Multi-Agent Reinforcement Learning - 专知论文

会员服务 ·

0

Learning · Agent · Continuity · 可交换的 · 可约的 ·

Incentive-Aligned Vehicle-to-Vehicle Energy Trading via Nash-Integrated Multi-Agent Reinforcement Learning

翻译：面向激励对齐的车对车能源交易：基于纳什集成的多智能体强化学习方法

Yujin Lin,Yue Yang,Hao Wang

from arxiv, The 24th IEEE International Conference on Industrial Informatics, 2026

Vehicle-to-vehicle (V2V) energy trading enables decentralized peer-to-peer energy exchange among electric vehicles (EVs), reducing grid dependency while monetizing surplus capacity. However, coordinating self-interested EV agents with diverse charging needs and uncertain arrival-departure schedules remains challenging. Existing approaches either require centralized optimization with computational limitations or lack fairness guarantees. This paper integrates Nash Bargaining Solution into Multi-Agent Deep Deterministic Policy Gradient, namely Nash-MADDPG, for incentive-aligned V2V energy trading. Nash bargaining determines efficient bilateral pricing, while Nash-guided price proximity rewards align agent learning toward bargaining-optimal strategies. Evaluation over 30-day continuous operation demonstrates an improvement of 61.6% in social welfare and 62.9% improvement in trading volume over Double Auction, while achieving superior fairness, such as 40.1% improvement in Jain's index. Testing across 6-100 agents over a 30-day horizon with continuous vehicle turnover confirms scalability across population size and empirically stable pricing near the Nash Bargaining benchmark.

翻译：车对车（V2V）能源交易实现了电动汽车（EV）间去中心化的点对点能源交换，在减少电网依赖的同时将剩余容量货币化。然而，协调具有多样充电需求及不确定到离时刻的利己EV智能体仍具挑战性。现有方法要么需依赖存在计算局限性的集中优化，要么缺乏公平性保障。本文将纳什议价解（Nash Bargaining Solution）集成至多智能体深度确定性策略梯度（Multi-Agent Deep Deterministic Policy Gradient）中，即Nash-MADDPG，实现面向激励对齐的V2V能源交易。纳什议价机制确定高效的双边定价，而纳什引导的价格接近度奖励引导智能体学习趋近于议价最优策略。基于30天连续运行的评估表明：相较于双重拍卖，社会总福利提升61.6%，交易量提升62.9%，同时实现更优的公平性——例如Jain指数提升40.1%。在30天时间内针对6至100个智能体（含持续车辆周转）的测试，证实了该方法在人囗规模上的可扩展性及经验定价的稳定性——其价格接近于纳什议价基准。

0

相关内容

Learning

多智能体通信：多智能体强化学习到涌现语言和大语言模型的综述

多智能体通信：多智能体强化学习到涌现语言和大语言模型的综述

专知会员服务

16+阅读 · 2月13日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

47+阅读 · 2025年5月6日

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

专知会员服务

47+阅读 · 2025年3月20日

智能驾驶系列报告（五）：新能源汽车竞逐智驾，梯次发展雏形或现

智能驾驶系列报告（五）：新能源汽车竞逐智驾，梯次发展雏形或现

专知会员服务

20+阅读 · 2024年11月4日

多智能体博弈、学习与控制

多智能体博弈、学习与控制

专知会员服务

128+阅读 · 2023年1月18日

「强化学习在无人车领域」的应用与展望

「强化学习在无人车领域」的应用与展望

专知会员服务

58+阅读 · 2022年12月8日

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

专知会员服务

25+阅读 · 2022年7月15日

《车联网数据安全监管制度研究报告 2022》，22页PDF，毕马威中国、观韬中茂律师事务所

《车联网数据安全监管制度研究报告 2022》，22页PDF，毕马威中国、观韬中茂律师事务所

专知会员服务

15+阅读 · 2022年3月23日

最新「智能车联网」综述论文，170篇文献全面概述智能车联网（VANETs）技术

专知会员服务

26+阅读 · 2021年8月9日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

基于MaaS的智慧交通体系

基于MaaS的智慧交通体系

智能交通技术

11+阅读 · 2019年6月13日

我国智能网联汽车车路协同发展路线政策及示范环境研究

我国智能网联汽车车路协同发展路线政策及示范环境研究

智能交通技术

14+阅读 · 2019年4月28日

车路协同应用场景分析

车路协同应用场景分析

智能交通技术

24+阅读 · 2019年4月13日

车路协同构建“通信+计算”新体系

车路协同构建“通信+计算”新体系

智能交通技术

11+阅读 · 2019年3月26日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

产业智能官

18+阅读 · 2018年11月22日

基于模型的系统工程——自动驾驶汽车（20180928更新）

基于模型的系统工程——自动驾驶汽车（20180928更新）

UMLChina

20+阅读 · 2018年9月28日

一种轻量级在线多目标车辆跟踪方法

一种轻量级在线多目标车辆跟踪方法

极市平台

15+阅读 · 2018年8月18日

面向绿色交通的智能车辆变工况行驶能耗反馈与耗散控制方法

国家自然科学基金

0+阅读 · 2015年12月31日

分布式全线控电动汽车可重构集成控制策略研究

国家自然科学基金

1+阅读 · 2015年12月31日

燃料电池混合动力系统的能量管理优化策略及其解耦控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能电网多元储能系统的信息综合利用及自学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于摄动法的轮毂电机分布式驱动车体姿态动力学分析与控制

国家自然科学基金

0+阅读 · 2015年12月31日

基于中国典型城市交通流特征与多参量解耦观测的客车混合动力系统运行优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

能量双向馈动的电动汽车无线充放电系统关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于电动汽车的交通系统和电力系统的融合、均衡与优化

国家自然科学基金

2+阅读 · 2014年12月31日

基于神经网络和强化学习的车辆装配系统中的多载量小车实时调度方法

国家自然科学基金

4+阅读 · 2014年12月31日

电动汽车与可再生能源的时空耦合特性及能量调度和容量配置的协同进化方法

国家自然科学基金

1+阅读 · 2014年12月31日

Multi-Agent Embodied Autonomous Driving: From V2X Information Exchange to Shared World Models

Arxiv

0+阅读 · 6月11日

Learning to Contest: Decentralized Robust Fairness in Cooperative MARL via Cross-Attention

Arxiv

0+阅读 · 6月11日

Multi-agent rendezvous in fluid flows via reinforcement learning

Arxiv

0+阅读 · 6月9日

A Survey on Deep Multi-Task Learning in Connected Autonomous Vehicles

Arxiv

0+阅读 · 6月5日

Quantum-Inspired Reinforcement Learning for Low-Latency Intrusion Detection in V2X and Internet-of-Vehicles Networks

Arxiv

0+阅读 · 6月5日

Scaling up Energy-Aware Multi-Agent Reinforcement Learning for Mission-Oriented Drone Networks with Individual Reward

Arxiv

0+阅读 · 5月24日

Integrated Sensing, Communication, and Computing for NR-V2X: A Cross-Layer Resource Allocation Framework Using Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 5月24日

Planning, Scheduling, and Behavior in EV Charging Systems: A Critical Survey and Trilemma Framework

Arxiv

0+阅读 · 5月20日

Automated Byzantine-Resilient Clustered Decentralized Federated Learning for Battery Intelligence in Connected EVs

Arxiv

0+阅读 · 5月20日

Evolutionary Ensemble of Agents

Arxiv

0+阅读 · 5月14日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

1+阅读 · 今天14:49

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

1+阅读 · 今天14:47

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

1+阅读 · 今天14:45

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

3+阅读 · 今天14:22

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

4+阅读 · 今天13:50

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

3+阅读 · 今天13:33

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

3+阅读 · 今天13:30

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

3+阅读 · 今天13:28

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

3+阅读 · 今天13:13

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

2+阅读 · 今天13:10

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

5+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

7+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

5+阅读 · 6月16日

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

专知会员服务

5+阅读 · 6月16日

《通用大语言模型：无人机指挥与控制接口》最新40页

《通用大语言模型：无人机指挥与控制接口》最新40页

专知会员服务

15+阅读 · 6月16日

相关VIP内容

多智能体通信：多智能体强化学习到涌现语言和大语言模型的综述

多智能体通信：多智能体强化学习到涌现语言和大语言模型的综述

专知会员服务

16+阅读 · 2月13日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

47+阅读 · 2025年5月6日

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

专知会员服务

47+阅读 · 2025年3月20日

智能驾驶系列报告（五）：新能源汽车竞逐智驾，梯次发展雏形或现

智能驾驶系列报告（五）：新能源汽车竞逐智驾，梯次发展雏形或现

专知会员服务

20+阅读 · 2024年11月4日

多智能体博弈、学习与控制

多智能体博弈、学习与控制

专知会员服务

128+阅读 · 2023年1月18日

「强化学习在无人车领域」的应用与展望

「强化学习在无人车领域」的应用与展望

专知会员服务

58+阅读 · 2022年12月8日

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

专知会员服务

25+阅读 · 2022年7月15日

《车联网数据安全监管制度研究报告 2022》，22页PDF，毕马威中国、观韬中茂律师事务所

《车联网数据安全监管制度研究报告 2022》，22页PDF，毕马威中国、观韬中茂律师事务所

专知会员服务

15+阅读 · 2022年3月23日

最新「智能车联网」综述论文，170篇文献全面概述智能车联网（VANETs）技术

专知会员服务

26+阅读 · 2021年8月9日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

热门VIP内容

开通专知VIP会员享更多权益服务

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

学习数据的几何：形状空间分析数学综述

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

基于MaaS的智慧交通体系

基于MaaS的智慧交通体系

智能交通技术

11+阅读 · 2019年6月13日

我国智能网联汽车车路协同发展路线政策及示范环境研究

我国智能网联汽车车路协同发展路线政策及示范环境研究

智能交通技术

14+阅读 · 2019年4月28日

车路协同应用场景分析

车路协同应用场景分析

智能交通技术

24+阅读 · 2019年4月13日

车路协同构建“通信+计算”新体系

车路协同构建“通信+计算”新体系

智能交通技术

11+阅读 · 2019年3月26日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

【人工智能】【智能驾驶】人工智能在汽车自动驾驶系统中的应用分析

产业智能官

18+阅读 · 2018年11月22日

基于模型的系统工程——自动驾驶汽车（20180928更新）

基于模型的系统工程——自动驾驶汽车（20180928更新）

UMLChina

20+阅读 · 2018年9月28日

一种轻量级在线多目标车辆跟踪方法

一种轻量级在线多目标车辆跟踪方法

极市平台

15+阅读 · 2018年8月18日

相关论文

Multi-Agent Embodied Autonomous Driving: From V2X Information Exchange to Shared World Models

Arxiv

0+阅读 · 6月11日

Learning to Contest: Decentralized Robust Fairness in Cooperative MARL via Cross-Attention

Arxiv

0+阅读 · 6月11日

Multi-agent rendezvous in fluid flows via reinforcement learning

Arxiv

0+阅读 · 6月9日

A Survey on Deep Multi-Task Learning in Connected Autonomous Vehicles

Arxiv

0+阅读 · 6月5日

Quantum-Inspired Reinforcement Learning for Low-Latency Intrusion Detection in V2X and Internet-of-Vehicles Networks

Arxiv

0+阅读 · 6月5日

Scaling up Energy-Aware Multi-Agent Reinforcement Learning for Mission-Oriented Drone Networks with Individual Reward

Arxiv

0+阅读 · 5月24日

Integrated Sensing, Communication, and Computing for NR-V2X: A Cross-Layer Resource Allocation Framework Using Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 5月24日

Planning, Scheduling, and Behavior in EV Charging Systems: A Critical Survey and Trilemma Framework

Arxiv

0+阅读 · 5月20日

Automated Byzantine-Resilient Clustered Decentralized Federated Learning for Battery Intelligence in Connected EVs

Arxiv

0+阅读 · 5月20日

Evolutionary Ensemble of Agents

Arxiv

0+阅读 · 5月14日

相关基金

面向绿色交通的智能车辆变工况行驶能耗反馈与耗散控制方法

国家自然科学基金

0+阅读 · 2015年12月31日

分布式全线控电动汽车可重构集成控制策略研究

国家自然科学基金

1+阅读 · 2015年12月31日

燃料电池混合动力系统的能量管理优化策略及其解耦控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能电网多元储能系统的信息综合利用及自学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于摄动法的轮毂电机分布式驱动车体姿态动力学分析与控制

国家自然科学基金

0+阅读 · 2015年12月31日

基于中国典型城市交通流特征与多参量解耦观测的客车混合动力系统运行优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

能量双向馈动的电动汽车无线充放电系统关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于电动汽车的交通系统和电力系统的融合、均衡与优化

国家自然科学基金

2+阅读 · 2014年12月31日

基于神经网络和强化学习的车辆装配系统中的多载量小车实时调度方法

国家自然科学基金

4+阅读 · 2014年12月31日

电动汽车与可再生能源的时空耦合特性及能量调度和容量配置的协同进化方法

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员