成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
多臂赌博机
关注
0
综合
百科
VIP
热门
动态
论文
精华
Poisson-MNL Bandit: Nearly Optimal Dynamic Joint Assortment and Pricing with Decision-Dependent Customer Arrivals
Arxiv
0+阅读 · 2月18日
Flickering Multi-Armed Bandits
Arxiv
0+阅读 · 2月19日
Bandit Allocational Instability
Arxiv
0+阅读 · 2月7日
Risk-inclusive Contextual Bandits for Early Phase Clinical Trials
Arxiv
0+阅读 · 2月12日
Lipschitz Bandits with Stochastic Delayed Feedback
Arxiv
0+阅读 · 2月11日
FastFlow: Accelerating The Generative Flow Matching Models with Bandit Inference
Arxiv
0+阅读 · 2月11日
Rising Multi-Armed Bandits with Known Horizons
Arxiv
0+阅读 · 2月11日
Replicable Constrained Bandits
Arxiv
0+阅读 · 2月16日
Optimism Stabilizes Thompson Sampling for Adaptive Inference
Arxiv
0+阅读 · 2月5日
Joint Sleep Mode Activation and Load Balancing with Dynamic Cell Load: A Combinatorial Bandit Approach
Arxiv
0+阅读 · 2月4日
Individual Regret in Cooperative Stochastic Multi-Armed Bandits
Arxiv
0+阅读 · 2月3日
Improved Algorithms for Nash Welfare in Linear Bandits
Arxiv
0+阅读 · 1月30日
Efficient Clustering in Stochastic Bandits
Arxiv
0+阅读 · 1月14日
Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards
Arxiv
0+阅读 · 1月25日
Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards
Arxiv
0+阅读 · 1月27日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top