成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
正则化
关注
9
在数学,统计学和计算机科学中,尤其是在机器学习和逆问题中,正则化是添加信息以解决不适定问题或防止过度拟合的过程。 正则化适用于不适定的优化问题中的目标函数。
综合
百科
VIP
热门
动态
论文
精华
A Comedy of Estimators: On KL Regularization in RL Training of LLMs
Arxiv
0+阅读 · 1月6日
Source-Optimal Training is Transfer-Suboptimal
Arxiv
0+阅读 · 1月6日
Q-Regularized Generative Auto-Bidding: From Suboptimal Trajectories to Optimal Policies
Arxiv
0+阅读 · 1月6日
Convergence of a L2 regularized Policy Gradient Algorithm for the Multi Armed Bandit
Arxiv
0+阅读 · 1月5日
Higher-Order Action Regularization in Deep Reinforcement Learning: From Continuous Control to Building Energy Management
Arxiv
0+阅读 · 1月5日
A Linear Approach to Data Poisoning
Arxiv
0+阅读 · 1月5日
Causal Consistency Regularization: Training Verifiably Sensitive Reasoning in Large Language Models
Arxiv
0+阅读 · 1月5日
Gabliteration: Adaptive Multi-Directional Neural Weight Modification for Selective Behavioral Alteration in Large Language Models
Arxiv
0+阅读 · 1月5日
Rank-based Geographical Regularization: Revisiting Contrastive Self-Supervised Learning for Multispectral Remote Sensing Imagery
Arxiv
0+阅读 · 1月5日
Geometry-induced Regularization in Deep ReLU Neural Networks
Arxiv
0+阅读 · 1月5日
EdgeNeRF: Edge-Guided Regularization for Neural Radiance Fields from Sparse Views
Arxiv
0+阅读 · 1月4日
ORION: Option-Regularized Deep Reinforcement Learning for Cooperative Multi-Agent Online Navigation
Arxiv
0+阅读 · 1月3日
Improving Flexible Image Tokenizers for Autoregressive Image Generation
Arxiv
0+阅读 · 1月4日
Aletheia: Quantifying Cognitive Conviction in Reasoning Models via Regularized Inverse Confusion Matrix
Arxiv
0+阅读 · 1月4日
Dichotomous Diffusion Policy Optimization
Arxiv
0+阅读 · 2025年12月31日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top