Scale redundancy and soft gauge fixing in positively homogeneous neural networks - 专知论文

会员服务 ·

0

轨道 · 冗余 · 激活函数 · 不变 · 泛函 ·

Scale redundancy and soft gauge fixing in positively homogeneous neural networks

翻译：具有正齐次激活函数的神经网络中的尺度冗余与软规范固定

Rodrigo Carmo Terin

from arxiv, 13 pages, 5 figures, 2 tables

Neural networks with positively homogeneous activations exhibit an exact continuous reparametrization symmetry: neuron-wise rescalings generate parameter-space orbits along which the input--output function is invariant. We interpret this symmetry as a gauge redundancy and introduce gauge-adapted coordinates that separate invariant and scale-imbalance directions. Inspired by gauge fixing in field theory, we introduce a soft orbit-selection (norm-balancing) functional acting only on redundant scale coordinates. We show analytically that it induces dissipative relaxation of imbalance modes to preserve the realized function. In controlled experiments, this orbit-selection penalty expands the stable learning-rate regime and suppresses scale drift without changing expressivity. These results establish a structural link between gauge-orbit geometry and optimization conditioning, providing a concrete connection between gauge-theoretic concepts and machine learning.

翻译：具有正齐次激活函数的神经网络表现出精确的连续重参数化对称性：神经元级别的缩放会在参数空间中生成轨道，而输入-输出函数沿这些轨道保持不变。我们将此对称性解释为一种规范冗余，并引入适应规范的坐标以分离不变方向与尺度失衡方向。受场论中规范固定的启发，我们引入一种仅作用于冗余尺度坐标的软轨道选择（范数平衡）泛函。我们通过解析证明，该泛函会诱导失衡模式的耗散弛豫，从而保持已实现的函数不变。在受控实验中，这种轨道选择惩罚扩展了稳定学习率的范围，并在不改变表达能力的条件下抑制了尺度漂移。这些结果建立了规范轨道几何结构与优化条件之间的结构性联系，为规范理论概念与机器学习提供了具体关联。

0

相关内容

【牛津大学博士论文】超参数化神经网络的泛化与表达性，221页pdf

【牛津大学博士论文】超参数化神经网络的泛化与表达性，221页pdf

专知会员服务

32+阅读 · 2024年4月19日

【纽约大学博士论文】对称神经网络理论，148页pdf

【纽约大学博士论文】对称神经网络理论，148页pdf

专知会员服务

41+阅读 · 2024年4月4日

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

专知会员服务

26+阅读 · 2023年10月18日

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

专知会员服务

48+阅读 · 2022年10月24日

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

专知会员服务

52+阅读 · 2022年10月8日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

深度学习激活函数全面综述论文

深度学习激活函数全面综述论文

专知会员服务

72+阅读 · 2021年10月1日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【伯克利】神经网络中的对称性与同变性，附视频与114页ppt

【伯克利】神经网络中的对称性与同变性，附视频与114页ppt

专知会员服务

25+阅读 · 2020年10月2日

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

专知会员服务

19+阅读 · 2020年4月9日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

专知

36+阅读 · 2020年5月19日

激活函数还是有一点意思的！

激活函数还是有一点意思的！

计算机视觉战队

12+阅读 · 2019年6月28日

深入卷积神经网络背后的数学原理

深入卷积神经网络背后的数学原理

人工智能学家

10+阅读 · 2019年4月26日

干货 | 深入理解深度学习中的激活函数

干货 | 深入理解深度学习中的激活函数

计算机视觉life

16+阅读 · 2019年1月29日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

人工智能前沿讲习班

11+阅读 · 2018年10月22日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重网络中的级联与传播过程研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于张量结构和lq范数的低秩张量恢复和补全

国家自然科学基金

1+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

若干偏微分方程控制系统的适定正则性及稳定性分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

光刺激实现神经纤维选择性刺激的方法研究及理论模拟

国家自然科学基金

0+阅读 · 2015年12月31日

非线性不确定系统的齐次控制理论及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

径向偏振、锁模光纤激光器研究

国家自然科学基金

0+阅读 · 2014年12月31日

非凸非光滑优化的神经网络设计及其关键问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

Certified and accurate computation of function space norms of deep neural networks

Arxiv

0+阅读 · 3月6日

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Arxiv

0+阅读 · 3月4日

Aligned explanations in neural networks

Arxiv

0+阅读 · 2月28日

Smoothness Adaptivity in Constant-Depth Neural Networks: Optimal Rates via Smooth Activations

Arxiv

0+阅读 · 2月28日

On weight and variance uncertainty in neural networks for regression tasks

Arxiv

0+阅读 · 2月28日

Supervised Metric Regularization Through Alternating Optimization for Multi-Regime Physics-Informed Neural Networks

Arxiv

0+阅读 · 2月10日

The Condition Number as a Scale-Invariant Proxy for Information Encoding in Neural Units

Arxiv

0+阅读 · 2月8日

Diffeomorphism-Equivariant Neural Networks

Arxiv

0+阅读 · 2月6日

How Controlling the Variance can Improve Training Stability of Sparsely Activated DNNs and CNNs

Arxiv

0+阅读 · 2月5日

Equivariant Neural Networks for General Linear Symmetries on Lie Algebras

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

0+阅读 · 22分钟前

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

0+阅读 · 25分钟前

伊朗战争停火期间美军关键弹药状况分析

伊朗战争停火期间美军关键弹药状况分析

专知会员服务

5+阅读 · 今天11:13

电子战革命：塑造战场的十年突破（2015–2025）

电子战革命：塑造战场的十年突破（2015–2025）

专知会员服务

4+阅读 · 今天9:19

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

专知会员服务

5+阅读 · 今天9:00

《基于模型的系统工程框架及其在电子战系统中的应用》

《基于模型的系统工程框架及其在电子战系统中的应用》

专知会员服务

4+阅读 · 今天8:27

人工智能即服务与未来战争（印度视角）

人工智能即服务与未来战争（印度视角）

专知会员服务

2+阅读 · 今天7:57

《将量子技术集成到移动军事系统与战术作战中心框架》

《将量子技术集成到移动军事系统与战术作战中心框架》

专知会员服务

3+阅读 · 今天7:53

《美国战争部2027财年军事人员预算》

《美国战争部2027财年军事人员预算》

专知会员服务

2+阅读 · 今天7:44

伊朗战争中的电子战

伊朗战争中的电子战

专知会员服务

5+阅读 · 今天7:04

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

8+阅读 · 今天3:12

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

6+阅读 · 今天3:00

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

5+阅读 · 今天2:56

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

5+阅读 · 今天2:44

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

9+阅读 · 今天2:37

相关VIP内容

【牛津大学博士论文】超参数化神经网络的泛化与表达性，221页pdf

【牛津大学博士论文】超参数化神经网络的泛化与表达性，221页pdf

专知会员服务

32+阅读 · 2024年4月19日

【纽约大学博士论文】对称神经网络理论，148页pdf

【纽约大学博士论文】对称神经网络理论，148页pdf

专知会员服务

41+阅读 · 2024年4月4日

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

专知会员服务

26+阅读 · 2023年10月18日

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

专知会员服务

48+阅读 · 2022年10月24日

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

【牛津大学博士论文】学习神经网络中的不变表示，130页pdf

专知会员服务

52+阅读 · 2022年10月8日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

深度学习激活函数全面综述论文

深度学习激活函数全面综述论文

专知会员服务

72+阅读 · 2021年10月1日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【伯克利】神经网络中的对称性与同变性，附视频与114页ppt

【伯克利】神经网络中的对称性与同变性，附视频与114页ppt

专知会员服务

25+阅读 · 2020年10月2日

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

专知会员服务

19+阅读 · 2020年4月9日

热门VIP内容

开通专知VIP会员享更多权益服务

多智能体系统：从经典范式到大基础模型驱动的未来

电子战革命：塑造战场的十年突破（2015–2025）

【CMU博士论文】物理世界的视觉感知与深度理解

伊朗战争停火期间美军关键弹药状况分析

相关资讯

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

专知

36+阅读 · 2020年5月19日

激活函数还是有一点意思的！

激活函数还是有一点意思的！

计算机视觉战队

12+阅读 · 2019年6月28日

深入卷积神经网络背后的数学原理

深入卷积神经网络背后的数学原理

人工智能学家

10+阅读 · 2019年4月26日

干货 | 深入理解深度学习中的激活函数

干货 | 深入理解深度学习中的激活函数

计算机视觉life

16+阅读 · 2019年1月29日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

SFFAI报告 | 常建龙：深度卷积网络中的卷积算子研究进展

人工智能前沿讲习班

11+阅读 · 2018年10月22日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

相关论文

Certified and accurate computation of function space norms of deep neural networks

Arxiv

0+阅读 · 3月6日

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Arxiv

0+阅读 · 3月4日

Aligned explanations in neural networks

Arxiv

0+阅读 · 2月28日

Smoothness Adaptivity in Constant-Depth Neural Networks: Optimal Rates via Smooth Activations

Arxiv

0+阅读 · 2月28日

On weight and variance uncertainty in neural networks for regression tasks

Arxiv

0+阅读 · 2月28日

Supervised Metric Regularization Through Alternating Optimization for Multi-Regime Physics-Informed Neural Networks

Arxiv

0+阅读 · 2月10日

The Condition Number as a Scale-Invariant Proxy for Information Encoding in Neural Units

Arxiv

0+阅读 · 2月8日

Diffeomorphism-Equivariant Neural Networks

Arxiv

0+阅读 · 2月6日

How Controlling the Variance can Improve Training Stability of Sparsely Activated DNNs and CNNs

Arxiv

0+阅读 · 2月5日

Equivariant Neural Networks for General Linear Symmetries on Lie Algebras

Arxiv

0+阅读 · 1月30日

相关基金

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重网络中的级联与传播过程研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于张量结构和lq范数的低秩张量恢复和补全

国家自然科学基金

1+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

若干偏微分方程控制系统的适定正则性及稳定性分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

光刺激实现神经纤维选择性刺激的方法研究及理论模拟

国家自然科学基金

0+阅读 · 2015年12月31日

非线性不确定系统的齐次控制理论及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

径向偏振、锁模光纤激光器研究

国家自然科学基金

0+阅读 · 2014年12月31日

非凸非光滑优化的神经网络设计及其关键问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员