成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
奖励函数
关注
1
综合
百科
VIP
热门
动态
论文
精华
Multi-Agent Contracts
Arxiv
0+阅读 · 3月2日
Learning Acrobatic Flight from Preferences
Arxiv
0+阅读 · 3月3日
A Review of Reward Functions for Reinforcement Learning in the context of Autonomous Driving
Arxiv
0+阅读 · 3月4日
Model Predictive Adversarial Imitation Learning for Planning from Observation
Arxiv
0+阅读 · 3月2日
CRED: Counterfactual Reasoning and Environment Design for Active Preference Learning
Arxiv
0+阅读 · 3月9日
Equal-Pay Contracts
Arxiv
0+阅读 · 3月8日
Towards Dynamic Quadrupedal Gaits: A Symmetry-Guided RL Hierarchy Enables Free Gait Transitions at Varying Speeds
Arxiv
0+阅读 · 2月11日
Single Index Bandits: Generalized Linear Contextual Bandits with Unknown Reward Functions
Arxiv
0+阅读 · 2月7日
ManeuverNet: A Soft Actor-Critic Framework for Precise Maneuvering of Double-Ackermann-Steering Robots with Optimized Reward Functions
Arxiv
0+阅读 · 2月16日
Peeking inside the Black-Box: Reinforcement Learning for Explainable and Accurate Relation Extraction
Arxiv
0+阅读 · 2月16日
$\mathcal{X}$-KD: General Experiential Knowledge Distillation for Large Language Models
Arxiv
0+阅读 · 2月13日
CODE-SHARP: Continuous Open-ended Discovery and Evolution of Skills as Hierarchical Reward Programs
Arxiv
0+阅读 · 2月10日
Beyond Rewards in Reinforcement Learning for Cyber Defence
Arxiv
0+阅读 · 2月12日
Reinforcement Learning Enhancement Using Vector Semantic Representation and Symbolic Reasoning for Human-Centered Autonomous Emergency Braking
Arxiv
0+阅读 · 2月4日
Beyond Rewards in Reinforcement Learning for Cyber Defence
Arxiv
0+阅读 · 2月4日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top