We propose ASL360, an adaptive deep reinforcement learning-based scheduler for on-demand 360$^\circ$ video streaming to mobile VR users in next generation wireless networks. We aim to maximize the overall Quality of Experience (QoE) of the users served over a UAV-assisted 5G wireless network. Our system model comprises a macro base station (MBS) and a UAV-mounted base station which both deploy mm-Wave transmission to the users. The 360$^\circ$ video is encoded into dependent layers and segmented tiles, allowing a user to schedule downloads of each layer's segments. Furthermore, each user utilizes multiple buffers to store the corresponding video layer's segments. We model the scheduling decision as a Constrained Markov Decision Process (CMDP), where the agent selects Base or Enhancement layers to maximize the QoE and use a policy gradient-based method (PPO) to find the optimal policy. Additionally, we implement a dynamic adjustment mechanism for cost components, allowing the system to adaptively balance and prioritize the video quality, buffer occupancy, and quality change based on real-time network and streaming session conditions. We demonstrate that ASL360 significantly improves the QoE, achieving approximately 2 dB higher average video quality, 80% lower average rebuffering time, and 57% lower video quality variation, relative to competitive baseline methods. Our results show the effectiveness of our layered and adaptive approach in enhancing the QoE in immersive videostreaming applications, particularly in dynamic and challenging network environments.


翻译:本文提出ASL360,一种基于自适应深度强化学习的调度器,用于下一代无线网络中面向移动VR用户的按需360°视频流传输。我们的目标是在无人机辅助的5G无线网络中最大化所服务用户的整体体验质量。系统模型包含宏基站和无人机搭载基站,两者均采用毫米波传输技术向用户提供服务。360°视频被编码为相互依赖的层次结构及分块片段,允许用户调度下载各层次的视频段。此外,每个用户利用多个缓冲区存储相应视频层次的片段。我们将调度决策建模为约束马尔可夫决策过程,其中智能体选择基础层或增强层以最大化体验质量,并采用基于策略梯度的近端策略优化方法求解最优策略。同时,我们实现了成本分量的动态调整机制,使系统能够根据实时网络和流媒体会话状态,自适应地平衡并优先处理视频质量、缓冲区占用率及质量波动。实验表明,相较于现有基准方法,ASL360显著提升了体验质量:平均视频质量提高约2 dB,平均卡顿时间降低80%,视频质量波动减少57%。研究结果验证了我们的分层自适应方法在沉浸式视频流应用(特别是在动态且具有挑战性的网络环境中)提升体验质量的有效性。

0
下载
关闭预览

相关内容

《软件化无人机网络》208页
专知会员服务
61+阅读 · 2025年3月24日
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
新年快乐!无人机测控通信自组网技术综述
无人机
32+阅读 · 2019年2月5日
AI如何帮助卫星遥感释放价值?
未来论坛
19+阅读 · 2018年8月8日
智能无人作战系统的发展
科技导报
36+阅读 · 2018年6月29日
开源自动语音识别系统wav2letter (附实现教程)
七月在线实验室
10+阅读 · 2018年1月8日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
国家自然科学基金
12+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
28+阅读 · 2011年12月31日
VIP会员
最新内容
帕兰蒂尔Maven:军事人工智能的新纪元
专知会员服务
0+阅读 · 48分钟前
超越网格:作战环境对炮兵的影响
专知会员服务
2+阅读 · 5月31日
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
6+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
7+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
19+阅读 · 5月30日
相关VIP内容
《软件化无人机网络》208页
专知会员服务
61+阅读 · 2025年3月24日
相关资讯
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
新年快乐!无人机测控通信自组网技术综述
无人机
32+阅读 · 2019年2月5日
AI如何帮助卫星遥感释放价值?
未来论坛
19+阅读 · 2018年8月8日
智能无人作战系统的发展
科技导报
36+阅读 · 2018年6月29日
开源自动语音识别系统wav2letter (附实现教程)
七月在线实验室
10+阅读 · 2018年1月8日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
相关基金
国家自然科学基金
12+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
28+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员