成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
梯度估计
关注
0
综合
百科
VIP
热门
动态
论文
精华
Gradient Testing and Estimation by Comparisons
Arxiv
0+阅读 · 2月19日
Stein-Rule Shrinkage for Stochastic Gradient Estimation in High Dimensions
Arxiv
0+阅读 · 2月6日
A Multi-Fidelity Control Variate Approach for Policy Gradient Estimation
Arxiv
0+阅读 · 2月12日
Unbiased Gradient Estimation for Event Binning via Functional Backpropagation
Arxiv
0+阅读 · 2月13日
Informed Asymmetric Actor-Critic: Leveraging Privileged Signals Beyond Full-State Access
Arxiv
0+阅读 · 2月5日
Bures-Wasserstein Importance-Weighted Evidence Lower Bound: Exposition and Applications
Arxiv
0+阅读 · 2月4日
A Hitchhiker's Guide to Poisson Gradient Estimation
Arxiv
0+阅读 · 2月3日
Stein-Rule Shrinkage for Stochastic Gradient Estimation in High Dimensions
Arxiv
0+阅读 · 2月2日
Importance Weighted Variational Inference without the Reparameterization Trick
Arxiv
0+阅读 · 2月1日
Dimensional Peeking for Low-Variance Gradients in Zeroth-Order Discrete Optimization via Simulation
Arxiv
0+阅读 · 1月21日
Quartet II: Accurate LLM Pre-Training in NVFP4 by Improved Unbiased Gradient Estimation
Arxiv
0+阅读 · 1月30日
OBLR-PO: A Theoretical Framework for Stable Reinforcement Learning
Arxiv
0+阅读 · 1月15日
Stabilizing Policy Gradient Methods via Reward Profiling
Arxiv
0+阅读 · 1月24日
Provable Acceleration of Distributed Optimization with Local Updates
Arxiv
0+阅读 · 1月14日
E-QRGMM: Efficient Generative Metamodeling for Covariate-Dependent Uncertainty Quantification
Arxiv
0+阅读 · 1月27日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top