成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
值函数
关注
0
综合
百科
VIP
热门
动态
论文
精华
Obfuscated Consensus
Arxiv
0+阅读 · 2月19日
Learning with Boolean threshold functions
Arxiv
0+阅读 · 2月19日
Continuous-Time Value Iteration for Multi-Agent Reinforcement Learning
Arxiv
0+阅读 · 2月19日
Simultaneous Ordinal Maximin Share and Envy-Based Guarantees
Arxiv
0+阅读 · 2月17日
Testing Monotonicity of Real-Valued Functions on DAGs
Arxiv
0+阅读 · 2月17日
Efficient Policy Optimization in Robust Constrained MDPs with Iteration Complexity Guarantees
Arxiv
0+阅读 · 2月7日
GAAVI: Global Asymptotic Anytime Valid Inference for the Conditional Mean Function
Arxiv
0+阅读 · 2月8日
Approximate-EFX Allocations with Ordinal and Limited Cardinal Information
Arxiv
0+阅读 · 2月9日
ALOE: Action-Level Off-Policy Evaluation for Vision-Language-Action Model Post-Training
Arxiv
0+阅读 · 2月13日
When agents choose bundles autonomously: guarantees beyond discrepancy
Arxiv
0+阅读 · 2月11日
Direct Soft-Policy Sampling via Langevin Dynamics
Arxiv
0+阅读 · 2月8日
Composable Model-Free RL for Navigation with Input-Affine Systems
Arxiv
0+阅读 · 2月13日
Human Preference Modeling Using Visual Motion Prediction Improves Robot Skill Learning from Egocentric Human Video
Arxiv
0+阅读 · 2月11日
Preference-Guided Prompt Optimization for Text-to-Image Generation
Arxiv
0+阅读 · 2月13日
Functional Critics Are Essential for Actor-Critic: From Off-Policy Stability to Efficient Exploration
Arxiv
0+阅读 · 2月8日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top