深度强化学习论文 - 专知

会员服务 ·

深度强化学习

深度强化学习

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而，传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下，深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

Capacity-constrained demand response in smart grids using deep reinforcement learning

Arxiv

0+阅读 · 2月18日

Rank-1 Approximation of Inverse Fisher for Natural Policy Gradients in Deep Reinforcement Learning

Arxiv

0+阅读 · 2月8日

Rank-1 Approximation of Inverse Fisher for Natural Policy Gradients in Deep Reinforcement Learning

Arxiv

0+阅读 · 2月11日

Optimistic World Models: Efficient Exploration in Model-Based Deep Reinforcement Learning

Arxiv

0+阅读 · 2月10日

Token Hidden Reward: Steering Exploration-Exploitation in Group Relative Deep Reinforcement Learning

Arxiv

0+阅读 · 2月15日

SoK: The Pitfalls of Deep Reinforcement Learning for Cybersecurity

Arxiv

0+阅读 · 2月9日

Peaceful Anarcho-Accelerationism: Decentralized Full Automation for a Society of Universal Care

Arxiv

0+阅读 · 2月13日

A Controlled Study of Double DQN and Dueling DQN Under Cross-Environment Transfer

Arxiv

0+阅读 · 2月11日

A Controlled Study of Double DQN and Dueling DQN Under Cross-Environment Transfer

Arxiv

0+阅读 · 2月10日

ManeuverNet: A Soft Actor-Critic Framework for Precise Maneuvering of Double-Ackermann-Steering Robots with Optimized Reward Functions

Arxiv

0+阅读 · 2月16日

Resilience Optimization in 6G and Beyond Integrated Satellite-Terrestrial Networks: A Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 2月1日

A Mobile Magnetic Manipulation Platform for Gastrointestinal Navigation with Deep Reinforcement Learning Control

Arxiv

0+阅读 · 1月22日

SymbXRL: Symbolic Explainable Deep Reinforcement Learning for Mobile Networks

Arxiv

0+阅读 · 1月29日

Rank-1 Approximation of Inverse Fisher for Natural Policy Gradients in Deep Reinforcement Learning

Arxiv

0+阅读 · 1月26日

A Deep Reinforcement Learning-Based TCP Congestion Control Algorithm: Design, Simulation, and Evaluation

Arxiv

0+阅读 · 1月19日

参考链接

微信扫码咨询专知VIP会员