Optimal Formats for Weight Quantisation - 专知论文

会员服务 ·

0

最优 · 约束 · KL散度 · 散度 · 设计 ·

Optimal Formats for Weight Quantisation

翻译：权重量化的最优格式

Douglas Orr,Luka Ribar,Carlo Luschi

from arxiv, 36 pages, 35 figures

Weight quantisation is an essential technique for enabling efficient training and deployment of modern deep learning models. However, the recipe book of quantisation formats is large and formats are often chosen empirically. In this paper, we propose a framework for systematic design and analysis of quantisation formats. By connecting the question of format design with the classical quantisation theory, we show that the strong practical performance of popular formats comes from their ability to represent values using variable-length codes. We frame the problem as minimising the KL divergence between original and quantised model outputs under a model size constraint, which can be approximated by minimising the squared quantisation error, a well-studied problem where entropy-constrained quantisers with variable-length codes are optimal. We develop non-linear quantisation curves for block-scaled data across multiple distribution families and observe that these formats, along with sparse outlier formats, consistently outperform fixed-length formats, indicating that they also exploit variable-length encoding. Finally, by using the relationship between the Fisher information and KL divergence, we derive the optimal allocation of bit-widths to individual parameter tensors across the model's layers, saving up to 0.25 bits per parameter when applied to large language models.

翻译：权重量化是实现现代深度学习模型高效训练与部署的关键技术。然而，量化格式的种类繁多，其选择往往依赖于经验。本文提出了一种用于系统化设计与分析量化格式的框架。通过将格式设计问题与经典量化理论相联系，我们证明了流行格式之所以具有优异的实际性能，源于其利用变长编码表示数值的能力。我们将该问题形式化为在模型大小约束下最小化原始模型与量化模型输出之间的KL散度，该问题可近似为最小化平方量化误差——这是一个已有深入研究的课题，其中采用变长编码的熵约束量化器是最优的。我们针对多种分布族开发了适用于块缩放数据的非线性量化曲线，并观察到这些格式（连同稀疏异常值格式）始终优于定长格式，表明它们同样利用了变长编码机制。最后，通过利用费舍尔信息与KL散度之间的关系，我们推导出模型中各层参数张量的最优位宽分配方案，将其应用于大型语言模型时，可节省高达每参数0.25比特的存储开销。

0

相关内容

【干货书】决策优化模型，640页pdf

【干货书】决策优化模型，640页pdf

专知会员服务

79+阅读 · 2023年5月4日

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

专知会员服务

83+阅读 · 2023年4月25日

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

专知会员服务

66+阅读 · 2023年2月15日

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

专知会员服务

48+阅读 · 2022年10月24日

南大《优化方法（Optimization Methods》课程，推荐！

南大《优化方法（Optimization Methods》课程，推荐！

专知会员服务

80+阅读 · 2022年4月3日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【ACL2021】Weight Distillation：神经网络权重知识迁移方法

专知会员服务

21+阅读 · 2021年8月17日

裴健等发布首篇「深度学习模型复杂性」综述论文，44页pdf阐述模型框架、模型规模、优化过程和数据复杂性

裴健等发布首篇「深度学习模型复杂性」综述论文，44页pdf阐述模型框架、模型规模、优化过程和数据复杂性

专知会员服务

52+阅读 · 2021年3月14日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知会员服务

281+阅读 · 2020年7月2日

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

专知会员服务

148+阅读 · 2019年12月28日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

多因素问题分析时，如何确立各因素权重？

多因素问题分析时，如何确立各因素权重？

人人都是产品经理

75+阅读 · 2020年3月4日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

神经网络中的权重初始化一览：从基础到Kaiming

神经网络中的权重初始化一览：从基础到Kaiming

大数据文摘

12+阅读 · 2019年4月18日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

AI量化交易，盘点你不可不知的行业信息！

AI量化交易，盘点你不可不知的行业信息！

专知

17+阅读 · 2019年1月9日

量化投资精品书籍

量化投资精品书籍

平均机器

18+阅读 · 2018年12月21日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【论文推荐】最新五篇度量学习相关论文—无标签、三维姿态估计、主动度量学习、深度度量学习、层次度量学习与匹配

【论文推荐】最新五篇度量学习相关论文—无标签、三维姿态估计、主动度量学习、深度度量学习、层次度量学习与匹配

专知

20+阅读 · 2018年4月5日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

多项式优化的最优性条件与最优化算法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

Quantized Inference for OneRec-V2

Arxiv

0+阅读 · 3月12日

Importance Weighting Correction of Regularized Least-Squares for Target Shift

Arxiv

0+阅读 · 3月3日

Reinforced Fast Weights with Next-Sequence Prediction

Arxiv

0+阅读 · 2月18日

On the Importance of a Multi-Scale Calibration for Quantization

Arxiv

0+阅读 · 2月7日

D$^2$Quant: Accurate Low-bit Post-Training Weight Quantization for LLMs

Arxiv

0+阅读 · 2月6日

Transmuting prompts into weights

Arxiv

0+阅读 · 2月5日

Price of universality in vector quantization is at most 0.11 bit

Arxiv

0+阅读 · 2月5日

Quantum Advantage in Decision Trees: A Weighted Graph and $L_1$ Norm Approach

Arxiv

0+阅读 · 2月4日

Weight Space Correlation Analysis: Quantifying Feature Utilization in Deep Learning Models

Arxiv

0+阅读 · 2月4日

Ensuring Semantics in Weights of Implicit Neural Representations through the Implicit Function Theorem

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

专知会员服务

0+阅读 · 8分钟前

《无人机革命：来自俄乌战场的启示》（报告）

《无人机革命：来自俄乌战场的启示》（报告）

专知会员服务

0+阅读 · 14分钟前

《实现联合作战能力所需的技术》58页报告

《实现联合作战能力所需的技术》58页报告

专知会员服务

0+阅读 · 32分钟前

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

专知会员服务

0+阅读 · 40分钟前

以色列运用人工智能优化空袭警报系统

以色列运用人工智能优化空袭警报系统

专知会员服务

0+阅读 · 42分钟前

以色列在多条战线部署AI智能体

以色列在多条战线部署AI智能体

专知会员服务

0+阅读 · 50分钟前

《将形式化方法工具应用于电子战代码库（经验报告）》

《将形式化方法工具应用于电子战代码库（经验报告）》

专知会员服务

0+阅读 · 53分钟前

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

12+阅读 · 4月25日

多智能体协作机制

多智能体协作机制

专知会员服务

11+阅读 · 4月25日

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

9+阅读 · 4月25日

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

19+阅读 · 4月25日

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

8+阅读 · 4月25日

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

12+阅读 · 4月25日

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

9+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

13+阅读 · 4月24日

相关VIP内容

【干货书】决策优化模型，640页pdf

【干货书】决策优化模型，640页pdf

专知会员服务

79+阅读 · 2023年5月4日

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

【牛津大学博士论文】深度学习中模型和数据的压缩，160页pdf

专知会员服务

83+阅读 · 2023年4月25日

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

专知会员服务

66+阅读 · 2023年2月15日

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

【加州理工学院博士论文】神经元网络的优化与泛化，98页pdf

专知会员服务

48+阅读 · 2022年10月24日

南大《优化方法（Optimization Methods》课程，推荐！

南大《优化方法（Optimization Methods》课程，推荐！

专知会员服务

80+阅读 · 2022年4月3日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【ACL2021】Weight Distillation：神经网络权重知识迁移方法

专知会员服务

21+阅读 · 2021年8月17日

裴健等发布首篇「深度学习模型复杂性」综述论文，44页pdf阐述模型框架、模型规模、优化过程和数据复杂性

裴健等发布首篇「深度学习模型复杂性」综述论文，44页pdf阐述模型框架、模型规模、优化过程和数据复杂性

专知会员服务

52+阅读 · 2021年3月14日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知会员服务

281+阅读 · 2020年7月2日

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

【论文】深度学习的最优化:理论和算法（Optimization for deep learning: theory and algorithms）

专知会员服务

148+阅读 · 2019年12月28日

热门VIP内容

开通专知VIP会员享更多权益服务

《实现联合作战能力所需的技术》58页报告

以色列运用人工智能优化空袭警报系统

《无人机革命：来自俄乌战场的启示》（报告）

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

相关资讯

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

多因素问题分析时，如何确立各因素权重？

多因素问题分析时，如何确立各因素权重？

人人都是产品经理

75+阅读 · 2020年3月4日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

神经网络中的权重初始化一览：从基础到Kaiming

神经网络中的权重初始化一览：从基础到Kaiming

大数据文摘

12+阅读 · 2019年4月18日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

AI量化交易，盘点你不可不知的行业信息！

AI量化交易，盘点你不可不知的行业信息！

专知

17+阅读 · 2019年1月9日

量化投资精品书籍

量化投资精品书籍

平均机器

18+阅读 · 2018年12月21日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【论文推荐】最新五篇度量学习相关论文—无标签、三维姿态估计、主动度量学习、深度度量学习、层次度量学习与匹配

【论文推荐】最新五篇度量学习相关论文—无标签、三维姿态估计、主动度量学习、深度度量学习、层次度量学习与匹配

专知

20+阅读 · 2018年4月5日

相关论文

Quantized Inference for OneRec-V2

Arxiv

0+阅读 · 3月12日

Importance Weighting Correction of Regularized Least-Squares for Target Shift

Arxiv

0+阅读 · 3月3日

Reinforced Fast Weights with Next-Sequence Prediction

Arxiv

0+阅读 · 2月18日

On the Importance of a Multi-Scale Calibration for Quantization

Arxiv

0+阅读 · 2月7日

D$^2$Quant: Accurate Low-bit Post-Training Weight Quantization for LLMs

Arxiv

0+阅读 · 2月6日

Transmuting prompts into weights

Arxiv

0+阅读 · 2月5日

Price of universality in vector quantization is at most 0.11 bit

Arxiv

0+阅读 · 2月5日

Quantum Advantage in Decision Trees: A Weighted Graph and $L_1$ Norm Approach

Arxiv

0+阅读 · 2月4日

Weight Space Correlation Analysis: Quantifying Feature Utilization in Deep Learning Models

Arxiv

0+阅读 · 2月4日

Ensuring Semantics in Weights of Implicit Neural Representations through the Implicit Function Theorem

Arxiv

0+阅读 · 1月30日

相关基金

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

多项式优化的最优性条件与最优化算法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员