成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
赌博机
关注
0
综合
百科
VIP
热门
动态
论文
精华
In-Context Reinforcement Learning through Bayesian Fusion of Context and Value Prior
Arxiv
0+阅读 · 1月6日
SPARKLE: A Nonparametric Approach for Online Decision-Making with High-Dimensional Covariates
Arxiv
0+阅读 · 1月6日
Quantum-Enhanced Neural Contextual Bandit Algorithms
Arxiv
0+阅读 · 1月6日
Prior Diffusiveness and Regret in the Linear-Gaussian Bandit
Arxiv
0+阅读 · 1月5日
Revisiting Weighted Strategy for Non-stationary Parametric Bandits and MDPs
Arxiv
0+阅读 · 1月3日
A Near-optimal, Scalable and Parallelizable Framework for Stochastic Bandits Robust to Adversarial Corruptions and Beyond
Arxiv
0+阅读 · 1月2日
Integrating Multi-Armed Bandit, Active Learning, and Distributed Computing for Scalable Optimization
Arxiv
0+阅读 · 1月2日
Laplacian Kernelized Bandit
Arxiv
0+阅读 · 1月1日
Sparse Additive Contextual Bandits: A Nonparametric Approach for Online Decision-Making with High-Dimensional Covariates
Arxiv
0+阅读 · 2025年12月31日
Precision Autotuning for Linear Solvers via Contextual Bandit-Based RL
Arxiv
0+阅读 · 1月2日
BandiK: Efficient Multi-Task Decomposition Using a Multi-Bandit Framework
Arxiv
0+阅读 · 2025年12月31日
BOAD: Discovering Hierarchical Software Engineering Agents via Bandit Optimization
Arxiv
0+阅读 · 2025年12月29日
Near-Optimal Regret for Efficient Stochastic Combinatorial Semi-Bandits
Arxiv
0+阅读 · 2025年12月28日
BALLAST: Bandit-Assisted Learning for Latency-Aware Stable Timeouts in Raft
Arxiv
0+阅读 · 2025年12月24日
Pairwise Elimination with Instance-Dependent Guarantees for Bandits with Cost Subsidy
Arxiv
0+阅读 · 2025年12月19日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top