成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
奖励函数
关注
1
综合
百科
VIP
热门
动态
论文
精华
Towards Dynamic Quadrupedal Gaits: A Symmetry-Guided RL Hierarchy Enables Free Gait Transitions at Varying Speeds
Arxiv
0+阅读 · 2月11日
Single Index Bandits: Generalized Linear Contextual Bandits with Unknown Reward Functions
Arxiv
0+阅读 · 2月7日
ManeuverNet: A Soft Actor-Critic Framework for Precise Maneuvering of Double-Ackermann-Steering Robots with Optimized Reward Functions
Arxiv
0+阅读 · 2月16日
Peeking inside the Black-Box: Reinforcement Learning for Explainable and Accurate Relation Extraction
Arxiv
0+阅读 · 2月16日
$\mathcal{X}$-KD: General Experiential Knowledge Distillation for Large Language Models
Arxiv
0+阅读 · 2月13日
CODE-SHARP: Continuous Open-ended Discovery and Evolution of Skills as Hierarchical Reward Programs
Arxiv
0+阅读 · 2月10日
Beyond Rewards in Reinforcement Learning for Cyber Defence
Arxiv
0+阅读 · 2月12日
Reinforcement Learning Enhancement Using Vector Semantic Representation and Symbolic Reasoning for Human-Centered Autonomous Emergency Braking
Arxiv
0+阅读 · 2月4日
Beyond Rewards in Reinforcement Learning for Cyber Defence
Arxiv
0+阅读 · 2月4日
medR: Reward Engineering for Clinical Offline Reinforcement Learning via Tri-Drive Potential Functions
Arxiv
0+阅读 · 2月4日
Reward Evolution with Graph-of-Thoughts: A Bi-Level Language Model Framework for Reinforcement Learning
Arxiv
0+阅读 · 2月2日
medR: Reward Engineering for Clinical Offline Reinforcement Learning via Tri-Drive Potential Functions
Arxiv
0+阅读 · 2月3日
Learning Reward Functions for Cooperative Resilience in Multi-Agent Systems
Arxiv
0+阅读 · 1月29日
GRACE: A Language Model Framework for Explainable Inverse Reinforcement Learning
Arxiv
0+阅读 · 1月28日
Decoding Rewards in Competitive Games: Inverse Game Theory with Entropy Regularization
Arxiv
0+阅读 · 1月19日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top