二次无约束二进制优化在二元神经网络训练与正则化中的应用 (Quadratic Unconstrained Binary Optimisation for Training and Regularisation of Binary Neural Networks) - 专知论文

会员服务 ·

0

正则化 · 约束 · 神经网络 · AI · 离散 ·

Quadratic Unconstrained Binary Optimisation for Training and Regularisation of Binary Neural Networks

翻译：二次无约束二进制优化在二元神经网络训练与正则化中的应用

Jonas Christoffer Villumsen,Yusuke Sugita

from arxiv, 32 pages, 12 figures

Advances in artificial intelligence (AI) and deep learning have raised concerns about its increasing energy consumption, while demand for deploying AI in mobile devices and machines at the edge is growing. Binary neural networks (BNNs) have recently gained attention as energy and memory efficient models suitable for resource constrained environments; however, training BNNs exactly is computationally challenging because of its discrete characteristics. Recent work proposing a framework for training BNNs based on quadratic unconstrained binary optimisation (QUBO) and progress in the design of Ising machines for solving QUBO problems suggest a potential path to efficiently optimising discrete neural networks. In this work, we extend existing QUBO models for training BNNs to accommodate arbitrary network topologies and propose two novel methods for regularisation. The first method maximises neuron margins biasing the training process toward parameter configurations that yield larger pre-activation magnitudes. The second method employs a dropout-inspired iterative scheme in which reduced subnetworks are trained and used to adjust linear penalties on network parameters. We apply the proposed QUBO formulation to a small binary image classification problem and conduct computational experiments on a GPU-based Ising machine. The numerical results indicate that the proposed regularisation terms modify training behaviour and yield improvements in classification accuracy on data not present in the training set.

翻译：人工智能（AI）与深度学习的进展引发了对其能耗日益增长的担忧，与此同时，在移动设备及边缘端机器上部署AI的需求正不断增长。二元神经网络（BNNs）因其能源与内存高效性，近期作为适用于资源受限环境的模型受到关注；然而，由于其离散特性，精确训练BNNs在计算上具有挑战性。近期研究提出了基于二次无约束二进制优化（QUBO）的训练BNNs框架，以及用于求解QUBO问题的伊辛机设计进展，为高效优化离散神经网络提供了一条潜在路径。在本工作中，我们扩展了现有用于训练BNNs的QUBO模型，以适配任意网络拓扑结构，并提出了两种新颖的正则化方法。第一种方法最大化神经元间隔，使训练过程偏向于产生更大预激活幅度的参数配置。第二种方法采用受dropout启发的迭代方案，其中训练缩减后的子网络并用于调整网络参数的线性惩罚项。我们将所提出的QUBO公式应用于一个二元图像分类小问题，并在基于GPU的伊辛机上进行了计算实验。数值结果表明，所提出的正则化项改变了训练行为，并在训练集未出现的数据上提高了分类准确率。

0

相关内容

正则化

在数学，统计学和计算机科学中，尤其是在机器学习和逆问题中，正则化是添加信息以解决不适定问题或防止过度拟合的过程。正则化适用于不适定的优化问题中的目标函数。

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

专知会员服务

12+阅读 · 2025年6月15日

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

专知会员服务

15+阅读 · 2025年3月25日

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

26+阅读 · 2025年2月4日

【普林斯顿博士论文】在多样化资源受限硬件环境中增强深度神经网络，314页pdf

【普林斯顿博士论文】在多样化资源受限硬件环境中增强深度神经网络，314页pdf

专知会员服务

28+阅读 · 2024年3月4日

【2023新书】《二值神经网络：算法、架构和应用》

【2023新书】《二值神经网络：算法、架构和应用》

专知会员服务

66+阅读 · 2023年10月26日

能耗优化的神经网络轻量化方法研究进展

能耗优化的神经网络轻量化方法研究进展

专知会员服务

27+阅读 · 2023年1月29日

【ICML2021】二值化网络（BNN）训练与优化

专知会员服务

15+阅读 · 2021年7月24日

最新《图神经网络实用指南》2020论文，28页pdf

最新《图神经网络实用指南》2020论文，28页pdf

专知会员服务

222+阅读 · 2020年10月17日

【论文推荐】二值神经网络综述，Binary Neural Networks: A Survey

【论文推荐】二值神经网络综述，Binary Neural Networks: A Survey

专知会员服务

53+阅读 · 2020年4月8日

【ICLR2020】用实对二进制卷积训练二进制神经网络，Training Binary Neural Networks with Real-to-Binary Convolutions

【ICLR2020】用实对二进制卷积训练二进制神经网络，Training Binary Neural Networks with Real-to-Binary Convolutions

专知会员服务

26+阅读 · 2020年3月26日

【2022新书】元学习: 理论，算法和应用, 404页pdf

【2022新书】元学习: 理论，算法和应用, 404页pdf

专知

26+阅读 · 2022年11月27日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

专知

65+阅读 · 2020年1月17日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

自组织递归二型小波模糊神经网络的研究及在微型飞行器姿态控制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Energy-Efficient Neuromorphic Computing for Edge AI: A Framework with Adaptive Spiking Neural Networks and Hardware-Aware Optimization

Arxiv

0+阅读 · 2月2日

Optimizing Tensor Train Decomposition in DNNs for RISC-V Architectures Using Design Space Exploration and Compiler Optimizations

Arxiv

0+阅读 · 2月2日

SpikingGamma: Surrogate-Gradient Free and Temporally Precise Online Training of Spiking Neural Networks with Smoothed Delays

Arxiv

0+阅读 · 2月2日

Spiking Brain Compression: Post-Training Second-order Compression for Spiking Neural Networks

Arxiv

0+阅读 · 1月28日

Deep Neural Networks as Iterated Function Systems and a Generalization Bound

Arxiv

0+阅读 · 1月27日

Energy-Aware DNN Graph Optimization

Arxiv

0+阅读 · 1月26日

Ternary Spiking Neural Networks Enhanced by Complemented Neurons and Membrane Potential Aggregation

Arxiv

0+阅读 · 1月22日

DNN Modularization via Activation-Driven Training

Arxiv

0+阅读 · 1月14日

Optimising for Energy Efficiency and Performance in Machine Learning

Arxiv

0+阅读 · 1月13日

Temporal Regularization Training: Unleashing the Potential of Spiking Neural Networks

Arxiv

0+阅读 · 1月10日

VIP会员

文章信息

相关主题

相关VIP内容

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

专知会员服务

12+阅读 · 2025年6月15日

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

专知会员服务

15+阅读 · 2025年3月25日

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

26+阅读 · 2025年2月4日

【普林斯顿博士论文】在多样化资源受限硬件环境中增强深度神经网络，314页pdf

【普林斯顿博士论文】在多样化资源受限硬件环境中增强深度神经网络，314页pdf

专知会员服务

28+阅读 · 2024年3月4日

【2023新书】《二值神经网络：算法、架构和应用》

【2023新书】《二值神经网络：算法、架构和应用》

专知会员服务

66+阅读 · 2023年10月26日

能耗优化的神经网络轻量化方法研究进展

能耗优化的神经网络轻量化方法研究进展

专知会员服务

27+阅读 · 2023年1月29日

【ICML2021】二值化网络（BNN）训练与优化

专知会员服务

15+阅读 · 2021年7月24日

最新《图神经网络实用指南》2020论文，28页pdf

最新《图神经网络实用指南》2020论文，28页pdf

专知会员服务

222+阅读 · 2020年10月17日

【论文推荐】二值神经网络综述，Binary Neural Networks: A Survey

【论文推荐】二值神经网络综述，Binary Neural Networks: A Survey

专知会员服务

53+阅读 · 2020年4月8日

【ICLR2020】用实对二进制卷积训练二进制神经网络，Training Binary Neural Networks with Real-to-Binary Convolutions

【ICLR2020】用实对二进制卷积训练二进制神经网络，Training Binary Neural Networks with Real-to-Binary Convolutions

专知会员服务

26+阅读 · 2020年3月26日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【2022新书】元学习: 理论，算法和应用, 404页pdf

【2022新书】元学习: 理论，算法和应用, 404页pdf

专知

26+阅读 · 2022年11月27日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

专知

65+阅读 · 2020年1月17日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

相关论文

Energy-Efficient Neuromorphic Computing for Edge AI: A Framework with Adaptive Spiking Neural Networks and Hardware-Aware Optimization

Arxiv

0+阅读 · 2月2日

Optimizing Tensor Train Decomposition in DNNs for RISC-V Architectures Using Design Space Exploration and Compiler Optimizations

Arxiv

0+阅读 · 2月2日

SpikingGamma: Surrogate-Gradient Free and Temporally Precise Online Training of Spiking Neural Networks with Smoothed Delays

Arxiv

0+阅读 · 2月2日

Spiking Brain Compression: Post-Training Second-order Compression for Spiking Neural Networks

Arxiv

0+阅读 · 1月28日

Deep Neural Networks as Iterated Function Systems and a Generalization Bound

Arxiv

0+阅读 · 1月27日

Energy-Aware DNN Graph Optimization

Arxiv

0+阅读 · 1月26日

Ternary Spiking Neural Networks Enhanced by Complemented Neurons and Membrane Potential Aggregation

Arxiv

0+阅读 · 1月22日

DNN Modularization via Activation-Driven Training

Arxiv

0+阅读 · 1月14日

Optimising for Energy Efficiency and Performance in Machine Learning

Arxiv

0+阅读 · 1月13日

Temporal Regularization Training: Unleashing the Potential of Spiking Neural Networks

Arxiv

0+阅读 · 1月10日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

自组织递归二型小波模糊神经网络的研究及在微型飞行器姿态控制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员