成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
深度强化学习
关注
156
深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。
综合
百科
VIP
热门
动态
论文
精华
Deep Reinforcement Learning-driven Edge Offloading for Latency-constrained XR pipelines
Arxiv
0+阅读 · 3月17日
DRL-Based Beam Positioning for LEO Satellite Constellations with Weighted Least Squares
Arxiv
0+阅读 · 3月17日
DRL-Based Beam Positioning for LEO Satellite Constellations with Weighted Least Squares
Arxiv
0+阅读 · 3月15日
Deep Reinforcement Learning Based Block Coordinate Descent for Downlink Weighted Sum-rate Maximization on AI-Native Wireless Networks
Arxiv
0+阅读 · 2月24日
Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control
Arxiv
0+阅读 · 3月9日
A Primer on SO(3) Action Representations in Deep Reinforcement Learning
Arxiv
0+阅读 · 2月21日
Network Topology Optimization via Deep Reinforcement Learning
Arxiv
0+阅读 · 3月3日
SliceFed: Federated Constrained Multi-Agent DRL for Dynamic Spectrum Slicing in 6G
Arxiv
0+阅读 · 3月12日
Boosting deep Reinforcement Learning using pretraining with Logical Options
Arxiv
0+阅读 · 3月6日
CAE: Repurposing the Critic as an Explorer in Deep Reinforcement Learning
Arxiv
0+阅读 · 2月20日
A Survey for Deep Reinforcement Learning Based Network Intrusion Detection
Arxiv
0+阅读 · 3月2日
Sim-to-reality adaptation for Deep Reinforcement Learning applied to an underwater docking application
Arxiv
0+阅读 · 3月12日
Capacity-constrained demand response in smart grids using deep reinforcement learning
Arxiv
0+阅读 · 2月18日
Rank-1 Approximation of Inverse Fisher for Natural Policy Gradients in Deep Reinforcement Learning
Arxiv
0+阅读 · 2月8日
Rank-1 Approximation of Inverse Fisher for Natural Policy Gradients in Deep Reinforcement Learning
Arxiv
0+阅读 · 2月11日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top