T3C：具有一致性保证的测试时张量压缩 (T3C: Test-Time Tensor Compression with Consistency Guarantees) - 专知论文

会员服务 ·

0

精度 · 一致 · 控制器 · 可调控 · 弹性 ·

T3C: Test-Time Tensor Compression with Consistency Guarantees

翻译：T3C：具有一致性保证的测试时张量压缩

Ismail Lamaakal,Chaymae Yahyati,Yassine Maleh,Khalid El Makkaoui,Ibrahim Ouahbi

We present T3C, a train-once, test-time budget-conditioned compression framework that exposes rank and precision as a controllable deployment knob. T3C combines elastic tensor factorization (maintained up to a maximal rank) with rank-tied mixed-precision quantization and a lightweight controller that maps a latency/energy/size budget token to per-layer rank/bit assignments; the policy snaps to hardware-aligned profiles and is monotone in the budget. A fast, layerwise consistency certificate, computed from spectral proxies and activation statistics, upper-bounds logit drift and regularizes training, yielding a practical reliability signal with negligible overhead. On ImageNet-1k, T3C shifts the vision Pareto frontier: for ResNet-50 at matched accuracy (\leq 0.5% drop), p50 latency is 1.18ms with a 38MB model, outperforming PTQ-8b (1.44ms, 88MB); for ViT-B/16, T3C reaches 2.30ms p50 with 59MB, improving over strong PTQ/QAT baselines. A single T3C checkpoint therefore provides predictable, certificate-backed accuracy-latency-size trade-offs on demand across devices.

翻译：本文提出T3C，一种一次性训练、测试时预算条件化的压缩框架，将秩和精度作为可调控的部署参数。T3C结合了弹性张量分解（维持至最大秩）、秩绑定的混合精度量化，以及一个轻量级控制器——该控制器将延迟/能耗/大小预算标记映射至每层的秩/比特分配；该策略会贴合硬件对齐的配置剖面，且随预算单调变化。通过从谱代理和激活统计量计算得到的快速分层一致性证书，可对逻辑偏移进行上界约束并正则化训练，从而以可忽略的开销提供实用的可靠性信号。在ImageNet-1k上，T3C推动了视觉帕累托前沿：对于ResNet-50在保持精度（下降≤0.5%）的情况下，p50延迟为1.18ms，模型大小为38MB，优于PTQ-8b（1.44ms，88MB）；对于ViT-B/16，T3C以59MB模型达到2.30ms的p50延迟，较PTQ/QAT基线有显著提升。因此，单个T3C检查点可在不同设备上按需提供可预测的、具备证书保障的精度-延迟-大小权衡。

0

相关内容

【ICLR2025】通过自适应熵感知优化实现稳健的多模态开放集测试时自适应

【ICLR2025】通过自适应熵感知优化实现稳健的多模态开放集测试时自适应

专知会员服务

10+阅读 · 2025年1月24日

《完整的 C5ISR 架构工具 (TC2AT)：通过集成架构能力改进美国防部架构框架 (DoDAF) 流程》

《完整的 C5ISR 架构工具 (TC2AT)：通过集成架构能力改进美国防部架构框架 (DoDAF) 流程》

专知会员服务

83+阅读 · 2024年12月10日

【NeurIPS2024】PACE：将参数高效微调中的泛化与一致性正则化结合起来

【NeurIPS2024】PACE：将参数高效微调中的泛化与一致性正则化结合起来

专知会员服务

14+阅读 · 2024年9月26日

【CVPR2024】视觉-语言模型的高效测试时间调整

【CVPR2024】视觉-语言模型的高效测试时间调整

专知会员服务

20+阅读 · 2024年3月30日

评估ChatGPT的信息提取能力:对性能、可解释性、校准和忠实度的评估

评估ChatGPT的信息提取能力:对性能、可解释性、校准和忠实度的评估

专知会员服务

76+阅读 · 2023年4月26日

《数字孪生评估、敏捷验证过程和虚拟化技术》美国防部

《数字孪生评估、敏捷验证过程和虚拟化技术》美国防部

专知会员服务

95+阅读 · 2023年3月11日

【估计定位、导航和授时（PNT）传感器和系统的目标位置误差】《多用途通用简化目标位置误差（TLE）计算器（MUSTC）》2022最新112页技术报告，美国陆军研究实验室

【估计定位、导航和授时（PNT）传感器和系统的目标位置误差】《多用途通用简化目标位置误差（TLE）计算器（MUSTC）》2022最新112页技术报告，美国陆军研究实验室

专知会员服务

46+阅读 · 2022年10月25日

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

专知会员服务

24+阅读 · 2022年8月2日

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

专知会员服务

36+阅读 · 2020年5月10日

【华为-诺亚实验室】动态BERT, Dynamic BERT with Adaptive Width and Depth

【华为-诺亚实验室】动态BERT, Dynamic BERT with Adaptive Width and Depth

专知会员服务

24+阅读 · 2020年4月13日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

《确保美国防御系统作战优势的必要美国防部射程能力：对未来战斗的测试》美国国家科学院151页报告

《确保美国防御系统作战优势的必要美国防部射程能力：对未来战斗的测试》美国国家科学院151页报告

专知

48+阅读 · 2022年11月12日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

【APC】先进过程控制系统（APC: Advanced Process Control）

【APC】先进过程控制系统（APC: Advanced Process Control）

产业智能官

69+阅读 · 2020年7月12日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

产业智能官

10+阅读 · 2018年12月20日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

三维谐振腔Transmon中的量子门操控和量子模拟

国家自然科学基金

0+阅读 · 2015年12月31日

时空上下文感知的云服务质量预测和推荐的研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑硅通孔热应力的静态时序分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

可压缩Navier-Stokes方程的能控性

国家自然科学基金

0+阅读 · 2015年12月31日

切换线性中立时滞系统的量化反馈控制设计

国家自然科学基金

0+阅读 · 2015年12月31日

面向学术资源的TSD与TDC测度及分析研究

国家自然科学基金

1+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

TBC1D7在心肌肥厚中的作用及其机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

Accelerating the Tesseract Decoder for Quantum Error Correction

Arxiv

0+阅读 · 2月4日

CoDiQ: Test-Time Scaling for Controllable Difficult Question Generation

Arxiv

0+阅读 · 2月2日

Predicting and improving test-time scaling laws via reward tail-guided search

Arxiv

0+阅读 · 2月1日

TSRBench: A Comprehensive Multi-task Multi-modal Time Series Reasoning Benchmark for Generalist Models

Arxiv

0+阅读 · 1月26日

TPV: Parameter Perturbations Through the Lens of Test Prediction Variance

Arxiv

0+阅读 · 1月22日

TSQCA: Threshold-Sweep Qualitative Comparative Analysis in R

Arxiv

0+阅读 · 1月19日

TPV: Parameter Perturbations Through the Lens of Test Prediction Variance

Arxiv

0+阅读 · 1月15日

Tensor Algebra Processing Primitives (TAPP): Towards a Standard for Tensor Operations

Tensor Algebra Processing Primitives (TAPP): Towards a Standard for Tensor Operations

Arxiv

0+阅读 · 1月12日

Fixturize: Bridging the Fixture Gap in Test Generation

Arxiv

0+阅读 · 1月10日

CIC: Circular Image Compression

Arxiv

0+阅读 · 1月2日

VIP会员

文章信息

相关主题

相关VIP内容

【ICLR2025】通过自适应熵感知优化实现稳健的多模态开放集测试时自适应

【ICLR2025】通过自适应熵感知优化实现稳健的多模态开放集测试时自适应

专知会员服务

10+阅读 · 2025年1月24日

《完整的 C5ISR 架构工具 (TC2AT)：通过集成架构能力改进美国防部架构框架 (DoDAF) 流程》

《完整的 C5ISR 架构工具 (TC2AT)：通过集成架构能力改进美国防部架构框架 (DoDAF) 流程》

专知会员服务

83+阅读 · 2024年12月10日

【NeurIPS2024】PACE：将参数高效微调中的泛化与一致性正则化结合起来

【NeurIPS2024】PACE：将参数高效微调中的泛化与一致性正则化结合起来

专知会员服务

14+阅读 · 2024年9月26日

【CVPR2024】视觉-语言模型的高效测试时间调整

【CVPR2024】视觉-语言模型的高效测试时间调整

专知会员服务

20+阅读 · 2024年3月30日

评估ChatGPT的信息提取能力:对性能、可解释性、校准和忠实度的评估

评估ChatGPT的信息提取能力:对性能、可解释性、校准和忠实度的评估

专知会员服务

76+阅读 · 2023年4月26日

《数字孪生评估、敏捷验证过程和虚拟化技术》美国防部

《数字孪生评估、敏捷验证过程和虚拟化技术》美国防部

专知会员服务

95+阅读 · 2023年3月11日

【估计定位、导航和授时（PNT）传感器和系统的目标位置误差】《多用途通用简化目标位置误差（TLE）计算器（MUSTC）》2022最新112页技术报告，美国陆军研究实验室

【估计定位、导航和授时（PNT）传感器和系统的目标位置误差】《多用途通用简化目标位置误差（TLE）计算器（MUSTC）》2022最新112页技术报告，美国陆军研究实验室

专知会员服务

46+阅读 · 2022年10月25日

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

专知会员服务

24+阅读 · 2022年8月2日

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

专知会员服务

36+阅读 · 2020年5月10日

【华为-诺亚实验室】动态BERT, Dynamic BERT with Adaptive Width and Depth

【华为-诺亚实验室】动态BERT, Dynamic BERT with Adaptive Width and Depth

专知会员服务

24+阅读 · 2020年4月13日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

《确保美国防御系统作战优势的必要美国防部射程能力：对未来战斗的测试》美国国家科学院151页报告

《确保美国防御系统作战优势的必要美国防部射程能力：对未来战斗的测试》美国国家科学院151页报告

专知

48+阅读 · 2022年11月12日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

【APC】先进过程控制系统（APC: Advanced Process Control）

【APC】先进过程控制系统（APC: Advanced Process Control）

产业智能官

69+阅读 · 2020年7月12日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

产业智能官

10+阅读 · 2018年12月20日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

相关论文

Accelerating the Tesseract Decoder for Quantum Error Correction

Arxiv

0+阅读 · 2月4日

CoDiQ: Test-Time Scaling for Controllable Difficult Question Generation

Arxiv

0+阅读 · 2月2日

Predicting and improving test-time scaling laws via reward tail-guided search

Arxiv

0+阅读 · 2月1日

TSRBench: A Comprehensive Multi-task Multi-modal Time Series Reasoning Benchmark for Generalist Models

Arxiv

0+阅读 · 1月26日

TPV: Parameter Perturbations Through the Lens of Test Prediction Variance

Arxiv

0+阅读 · 1月22日

TSQCA: Threshold-Sweep Qualitative Comparative Analysis in R

Arxiv

0+阅读 · 1月19日

TPV: Parameter Perturbations Through the Lens of Test Prediction Variance

Arxiv

0+阅读 · 1月15日

Tensor Algebra Processing Primitives (TAPP): Towards a Standard for Tensor Operations

Tensor Algebra Processing Primitives (TAPP): Towards a Standard for Tensor Operations

Arxiv

0+阅读 · 1月12日

Fixturize: Bridging the Fixture Gap in Test Generation

Arxiv

0+阅读 · 1月10日

CIC: Circular Image Compression

Arxiv

0+阅读 · 1月2日

相关基金

三维谐振腔Transmon中的量子门操控和量子模拟

国家自然科学基金

0+阅读 · 2015年12月31日

时空上下文感知的云服务质量预测和推荐的研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑硅通孔热应力的静态时序分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

可压缩Navier-Stokes方程的能控性

国家自然科学基金

0+阅读 · 2015年12月31日

切换线性中立时滞系统的量化反馈控制设计

国家自然科学基金

0+阅读 · 2015年12月31日

面向学术资源的TSD与TDC测度及分析研究

国家自然科学基金

1+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

TBC1D7在心肌肥厚中的作用及其机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员