We propose ASL360, an adaptive deep reinforcement learning-based scheduler for on-demand 360$^\circ$ video streaming to mobile VR users in next generation wireless networks. We aim to maximize the overall Quality of Experience (QoE) of the users served over a UAV-assisted 5G wireless network. Our system model comprises a macro base station (MBS) and a UAV-mounted base station which both deploy mm-Wave transmission to the users. The 360$^\circ$ video is encoded into dependent layers and segmented tiles, allowing a user to schedule downloads of each layer's segments. Furthermore, each user utilizes multiple buffers to store the corresponding video layer's segments. We model the scheduling decision as a Constrained Markov Decision Process (CMDP), where the agent selects Base or Enhancement layers to maximize the QoE and use a policy gradient-based method (PPO) to find the optimal policy. Additionally, we implement a dynamic adjustment mechanism for cost components, allowing the system to adaptively balance and prioritize the video quality, buffer occupancy, and quality change based on real-time network and streaming session conditions. We demonstrate that ASL360 significantly improves the QoE, achieving approximately 2 dB higher average video quality, 80% lower average rebuffering time, and 57% lower video quality variation, relative to competitive baseline methods. Our results show the effectiveness of our layered and adaptive approach in enhancing the QoE in immersive videostreaming applications, particularly in dynamic and challenging network environments.


翻译:本文提出ASL360,一种基于自适应深度强化学习的调度器,用于下一代无线网络中面向移动VR用户的按需360°视频流传输。我们的目标是在无人机辅助的5G无线网络中最大化所服务用户的整体体验质量。系统模型包含宏基站和无人机搭载基站,两者均采用毫米波传输技术向用户提供服务。360°视频被编码为相互依赖的层次结构及分块片段,允许用户调度下载各层次的视频段。此外,每个用户利用多个缓冲区存储相应视频层次的片段。我们将调度决策建模为约束马尔可夫决策过程,其中智能体选择基础层或增强层以最大化体验质量,并采用基于策略梯度的近端策略优化方法求解最优策略。同时,我们实现了成本分量的动态调整机制,使系统能够根据实时网络和流媒体会话状态,自适应地平衡并优先处理视频质量、缓冲区占用率及质量波动。实验表明,相较于现有基准方法,ASL360显著提升了体验质量:平均视频质量提高约2 dB,平均卡顿时间降低80%,视频质量波动减少57%。研究结果验证了我们的分层自适应方法在沉浸式视频流应用(特别是在动态且具有挑战性的网络环境中)提升体验质量的有效性。

0
下载
关闭预览

相关内容

《软件化无人机网络》208页
专知会员服务
61+阅读 · 2025年3月24日
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
新年快乐!无人机测控通信自组网技术综述
无人机
31+阅读 · 2019年2月5日
AI如何帮助卫星遥感释放价值?
未来论坛
19+阅读 · 2018年8月8日
智能无人作战系统的发展
科技导报
36+阅读 · 2018年6月29日
开源自动语音识别系统wav2letter (附实现教程)
七月在线实验室
10+阅读 · 2018年1月8日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
国家自然科学基金
12+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
27+阅读 · 2011年12月31日
VIP会员
最新内容
战争机器学习:数据生态系统构建(155页)
专知会员服务
6+阅读 · 今天8:10
内省扩散语言模型
专知会员服务
5+阅读 · 4月14日
国外反无人机系统与技术动态
专知会员服务
3+阅读 · 4月14日
大规模作战行动中的战术作战评估(研究论文)
未来的海战无人自主系统
专知会员服务
3+阅读 · 4月14日
美军多域作战现状分析:战略、概念还是幻想?
无人机与反无人机系统(书籍)
专知会员服务
19+阅读 · 4月14日
美陆军2026条令:安全与机动支援
专知会员服务
9+阅读 · 4月14日
相关VIP内容
《软件化无人机网络》208页
专知会员服务
61+阅读 · 2025年3月24日
相关资讯
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
新年快乐!无人机测控通信自组网技术综述
无人机
31+阅读 · 2019年2月5日
AI如何帮助卫星遥感释放价值?
未来论坛
19+阅读 · 2018年8月8日
智能无人作战系统的发展
科技导报
36+阅读 · 2018年6月29日
开源自动语音识别系统wav2letter (附实现教程)
七月在线实验室
10+阅读 · 2018年1月8日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
相关基金
国家自然科学基金
12+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
27+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员