高效强化学习论文 - 专知

会员服务 ·

高效强化学习

高效强化学习

Efficient Reinforcement Learning by Guiding World Models with Non-Curated Data

Arxiv

0+阅读 · 6月15日

ECHO-2: A Large-Scale Distributed Rollout Framework for Cost-Efficient Reinforcement Learning

Arxiv

0+阅读 · 5月26日

UI-AGILE: Advancing GUI Agents with Effective Reinforcement Learning and Precise Inference-Time Grounding

Arxiv

0+阅读 · 4月8日

ECHO-2: A Large-Scale Distributed Rollout Framework for Cost-Efficient Reinforcement Learning

Arxiv

0+阅读 · 3月31日

DreamerAD: Efficient Reinforcement Learning via Latent World Model for Autonomous Driving

Arxiv

0+阅读 · 3月25日

DreamerAD: Efficient Reinforcement Learning via Latent World Model for Autonomous Driving

Arxiv

0+阅读 · 4月1日

End-to-End Efficient RL for Linear Bellman Complete MDPs with Deterministic Transitions

Arxiv

0+阅读 · 3月24日

Efficient Reinforcement Learning for Large Language Models with Intrinsic Exploration

Arxiv

0+阅读 · 2月19日

QuRL: Efficient Reinforcement Learning with Quantized Rollout

Arxiv

0+阅读 · 2月15日

MiniRec: Data-Efficient Reinforcement Learning for LLM-based Recommendation

Arxiv

0+阅读 · 2月4日

Small Generalizable Prompt Predictive Models Can Steer Efficient RL Post-Training of Large Reasoning Models

Arxiv

0+阅读 · 2月2日

RL-BioAug: Label-Efficient Reinforcement Learning for Self-Supervised EEG Representation Learning

Arxiv

0+阅读 · 1月20日

Efficient Reinforcement Learning with Semantic and Token Entropy for LLM Reasoning

Arxiv

0+阅读 · 1月16日

Miner:Mining Intrinsic Mastery for Data-Efficient RL in Large Reasoning Models

Arxiv

0+阅读 · 1月8日

Replay Failures as Successes: Sample-Efficient Reinforcement Learning for Instruction Following

Arxiv

0+阅读 · 2025年12月29日

参考链接

微信扫码咨询专知VIP会员