成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
高效强化学习
关注
0
综合
百科
VIP
热门
动态
论文
精华
UI-AGILE: Advancing GUI Agents with Effective Reinforcement Learning and Precise Inference-Time Grounding
Arxiv
0+阅读 · 4月8日
ECHO-2: A Large-Scale Distributed Rollout Framework for Cost-Efficient Reinforcement Learning
Arxiv
0+阅读 · 3月31日
DreamerAD: Efficient Reinforcement Learning via Latent World Model for Autonomous Driving
Arxiv
0+阅读 · 3月25日
DreamerAD: Efficient Reinforcement Learning via Latent World Model for Autonomous Driving
Arxiv
0+阅读 · 4月1日
End-to-End Efficient RL for Linear Bellman Complete MDPs with Deterministic Transitions
Arxiv
0+阅读 · 3月24日
Efficient Reinforcement Learning for Large Language Models with Intrinsic Exploration
Arxiv
0+阅读 · 2月19日
QuRL: Efficient Reinforcement Learning with Quantized Rollout
Arxiv
0+阅读 · 2月15日
MiniRec: Data-Efficient Reinforcement Learning for LLM-based Recommendation
Arxiv
0+阅读 · 2月4日
Small Generalizable Prompt Predictive Models Can Steer Efficient RL Post-Training of Large Reasoning Models
Arxiv
0+阅读 · 2月2日
RL-BioAug: Label-Efficient Reinforcement Learning for Self-Supervised EEG Representation Learning
Arxiv
0+阅读 · 1月20日
Efficient Reinforcement Learning with Semantic and Token Entropy for LLM Reasoning
Arxiv
0+阅读 · 1月16日
Miner:Mining Intrinsic Mastery for Data-Efficient RL in Large Reasoning Models
Arxiv
0+阅读 · 1月8日
Replay Failures as Successes: Sample-Efficient Reinforcement Learning for Instruction Following
Arxiv
0+阅读 · 2025年12月29日
Efficient Reinforcement Learning with Semantic and Token Entropy for LLM Reasoning
Arxiv
0+阅读 · 2025年12月16日
Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Reinforcement Learning
Arxiv
0+阅读 · 2025年11月16日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top