离线强化学习论文 - 专知

会员服务 ·

离线强化学习

离线强化学习

Reversal Q-Learning

Arxiv

0+阅读 · 6月16日

Diffusion Offline Reinforcement Learning for Fair and Energy-Efficient UAV-Assisted Wireless Networks

Arxiv

0+阅读 · 6月15日

DRIVE: Distributional and Retrieval-Augmented Bidding with Value Evaluation

Arxiv

0+阅读 · 6月12日

On the Complexity of Offline Reinforcement Learning with $Q^\star$-Approximation and Partial Coverage

Arxiv

0+阅读 · 6月7日

RAMAC: Multimodal Risk-Aware Offline Reinforcement Learning and the Role of Behavior Regularization

Arxiv

0+阅读 · 6月11日

Cross-Domain Energy-Guided Diffusion Generation for Off-Dynamics Reinforcement Learning

Arxiv

0+阅读 · 5月24日

BORA: Bridging Offline Reinforcement Learning and Online Residual Adaptation for Real-World Dexterous VLA Models

Arxiv

0+阅读 · 6月6日

Robust Probabilistic Shielding for Safe Offline Reinforcement Learning

Arxiv

0+阅读 · 5月11日

120 Minutes and a Laptop: Minimalist Image-goal Navigation via Unsupervised Exploration and Offline RL

Arxiv

0+阅读 · 3月27日

MOBODY: Model Based Off-Dynamics Offline Reinforcement Learning

Arxiv

0+阅读 · 3月18日

Pseudo-Expert Regularized Offline RL for End-to-End Autonomous Driving in Photorealistic Closed-Loop Environments

Arxiv

0+阅读 · 4月9日

Fisher Decorator: Refining Flow Policy via A Local Transport Map

Arxiv

0+阅读 · 4月20日

TSN-Affinity: Similarity-Driven Parameter Reuse for Continual Offline Reinforcement Learning

Arxiv

0+阅读 · 4月28日

Adaptive $Q$-Aid for Conditional Supervised Learning in Offline Reinforcement Learning

Adaptive $Q$-Aid for Conditional Supervised Learning in Offline Reinforcement Learning

Arxiv

0+阅读 · 3月13日

Flow Actor-Critic for Offline Reinforcement Learning

Arxiv

0+阅读 · 2月20日

参考链接

微信扫码咨询专知VIP会员