Dataless Weight Disentanglement in Task Arithmetic via Kronecker-Factored Approximate Curvature - 专知论文

会员服务 ·

0

近似 · 曲率 · 分解 · 正则化 · 性能下降 ·

Dataless Weight Disentanglement in Task Arithmetic via Kronecker-Factored Approximate Curvature

翻译：基于克罗内克分解近似曲率的无数据权重解缠结任务算术

Angelo Porrello,Pietro Buzzega,Felix Dangel,Thomas Sommariva,Riccardo Salami,Lorenzo Bonicelli,Simone Calderara

from arxiv, Accepted to ICLR 2026

Task Arithmetic yields a modular, scalable way to adapt foundation models. Combining multiple task vectors, however, can lead to cross-task interference, causing representation drift and degraded performance. Representation drift regularization provides a natural remedy to disentangle task vectors; however, existing approaches typically require external task data, conflicting with modularity and data availability constraints (e.g., privacy requirements). We propose a dataless approach by framing regularization against representation drift as a curvature matrix approximation problem. This allows us to leverage well-established techniques; in particular, we adopt Kronecker-Factored Approximate Curvature and obtain a practical regularizer that achieves state-of-the-art results in task addition and negation. Our method has constant complexity in the number of tasks and promotes robustness to task vector rescaling, eliminating the need for held-out tuning.

翻译：任务算术为适应基础模型提供了一种模块化、可扩展的方法。然而，组合多个任务向量可能导致跨任务干扰，引发表征漂移和性能下降。表征漂移正则化为解缠结任务向量提供了一种自然的补救措施；然而，现有方法通常需要外部任务数据，这与模块化及数据可用性约束（例如隐私要求）相冲突。我们提出一种无数据方法，将针对表征漂移的正则化构建为曲率矩阵近似问题。这使我们能够利用成熟的技术；特别是，我们采用克罗内克分解近似曲率，并获得了一个实用的正则化器，在任务添加与否定方面取得了最先进的结果。我们的方法在任务数量上具有恒定复杂度，并增强了对任务向量重新缩放的鲁棒性，从而无需保留调优。

0

相关内容

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

【NeurIPS 2023】基于时间注意力的多任务强化学习对比模块

【NeurIPS 2023】基于时间注意力的多任务强化学习对比模块

专知会员服务

33+阅读 · 2023年11月5日

【伯克利博士论文】优化与机器学习中的结构驱动算法设计，420页pdf

【伯克利博士论文】优化与机器学习中的结构驱动算法设计，420页pdf

专知会员服务

45+阅读 · 2023年5月10日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知会员服务

57+阅读 · 2022年10月8日

【军用算法综述】《综述：军事应用中使用的一些重要算法》2022最新论文

【军用算法综述】《综述：军事应用中使用的一些重要算法》2022最新论文

专知会员服务

119+阅读 · 2022年7月1日

移动边缘计算中基于深度强化学习的任务卸载研究进展

专知会员服务

37+阅读 · 2021年7月8日

【KDD2020】基于节点-边缘协同解纠缠的可解释深图生成，Interpretable Deep Graph Generation with Node-edge Co-disentanglement

【KDD2020】基于节点-边缘协同解纠缠的可解释深图生成，Interpretable Deep Graph Generation with Node-edge Co-disentanglement

专知会员服务

32+阅读 · 2020年6月11日

【NeurIPS 2019论文PPT】通过任务感知调制的多模态模型不可知论元学习（Multimodal Model Agnostic Meta-Learning via Task-Aware Modulation）

【NeurIPS 2019论文PPT】通过任务感知调制的多模态模型不可知论元学习（Multimodal Model Agnostic Meta-Learning via Task-Aware Modulation）

专知会员服务

24+阅读 · 2019年12月30日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

27+阅读 · 2022年7月5日

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

13+阅读 · 2022年7月3日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

26+阅读 · 2021年1月30日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

面试题：请简要介绍下tensorflow的计算图

面试题：请简要介绍下tensorflow的计算图

七月在线实验室

14+阅读 · 2019年6月10日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

难解问题的固定参数近似算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非对称扰动下的拟线性椭圆方程解的多重性研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

结构矩阵计算的扰动理论与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

提高移动最小二乘近似无网格方法计算效率的技术和理论

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

An Implicit Compact-Kernel Material Point Method for Computational Solid Mechanics

Arxiv

0+阅读 · 4月20日

ACE-Merging: Data-Free Model Merging with Adaptive Covariance Estimation

Arxiv

0+阅读 · 4月8日

On the Decidability of Distributed Tasks with Output Sets under Asynchrony and Any Number of Crashes

Arxiv

0+阅读 · 4月8日

Distribution-dependent Generalization Bounds for Tuning Linear Regression Across Tasks

Arxiv

0+阅读 · 4月7日

Towards Generalizable Robotic Data Flywheel: High-Dimensional Factorization and Composition

Arxiv

0+阅读 · 3月26日

Decentralized Task Scheduling in Distributed Systems: A Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 3月25日

Weights to Code: Extracting Interpretable Algorithms from the Discrete Transformer

Arxiv

0+阅读 · 3月19日

Acceleration of multi-component multiple-precision arithmetic with branch-free algorithms and SIMD vectorization

Arxiv

0+阅读 · 3月16日

Faster Relational Algorithms Using Geometric Data Structures

Arxiv

0+阅读 · 3月12日

SLO-Aware Compute Resource Allocation for Prefill-Decode Disaggregated LLM Inference

Arxiv

0+阅读 · 3月5日

VIP会员

文章信息

相关主题

最新内容

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

7+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

5+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

6+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

4+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

8+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

7+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

4+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

2+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

5+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

3+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

4+阅读 · 7月17日

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

12+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

14+阅读 · 7月16日

相关VIP内容

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

【NeurIPS 2023】基于时间注意力的多任务强化学习对比模块

【NeurIPS 2023】基于时间注意力的多任务强化学习对比模块

专知会员服务

33+阅读 · 2023年11月5日

【伯克利博士论文】优化与机器学习中的结构驱动算法设计，420页pdf

【伯克利博士论文】优化与机器学习中的结构驱动算法设计，420页pdf

专知会员服务

45+阅读 · 2023年5月10日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知会员服务

57+阅读 · 2022年10月8日

【军用算法综述】《综述：军事应用中使用的一些重要算法》2022最新论文

【军用算法综述】《综述：军事应用中使用的一些重要算法》2022最新论文

专知会员服务

119+阅读 · 2022年7月1日

移动边缘计算中基于深度强化学习的任务卸载研究进展

专知会员服务

37+阅读 · 2021年7月8日

【KDD2020】基于节点-边缘协同解纠缠的可解释深图生成，Interpretable Deep Graph Generation with Node-edge Co-disentanglement

【KDD2020】基于节点-边缘协同解纠缠的可解释深图生成，Interpretable Deep Graph Generation with Node-edge Co-disentanglement

专知会员服务

32+阅读 · 2020年6月11日

【NeurIPS 2019论文PPT】通过任务感知调制的多模态模型不可知论元学习（Multimodal Model Agnostic Meta-Learning via Task-Aware Modulation）

【NeurIPS 2019论文PPT】通过任务感知调制的多模态模型不可知论元学习（Multimodal Model Agnostic Meta-Learning via Task-Aware Modulation）

专知会员服务

24+阅读 · 2019年12月30日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

相关资讯

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

27+阅读 · 2022年7月5日

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

13+阅读 · 2022年7月3日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

26+阅读 · 2021年1月30日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

面试题：请简要介绍下tensorflow的计算图

面试题：请简要介绍下tensorflow的计算图

七月在线实验室

14+阅读 · 2019年6月10日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

相关论文

An Implicit Compact-Kernel Material Point Method for Computational Solid Mechanics

Arxiv

0+阅读 · 4月20日

ACE-Merging: Data-Free Model Merging with Adaptive Covariance Estimation

Arxiv

0+阅读 · 4月8日

On the Decidability of Distributed Tasks with Output Sets under Asynchrony and Any Number of Crashes

Arxiv

0+阅读 · 4月8日

Distribution-dependent Generalization Bounds for Tuning Linear Regression Across Tasks

Arxiv

0+阅读 · 4月7日

Towards Generalizable Robotic Data Flywheel: High-Dimensional Factorization and Composition

Arxiv

0+阅读 · 3月26日

Decentralized Task Scheduling in Distributed Systems: A Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 3月25日

Weights to Code: Extracting Interpretable Algorithms from the Discrete Transformer

Arxiv

0+阅读 · 3月19日

Acceleration of multi-component multiple-precision arithmetic with branch-free algorithms and SIMD vectorization

Arxiv

0+阅读 · 3月16日

Faster Relational Algorithms Using Geometric Data Structures

Arxiv

0+阅读 · 3月12日

SLO-Aware Compute Resource Allocation for Prefill-Decode Disaggregated LLM Inference

Arxiv

0+阅读 · 3月5日

相关基金

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

难解问题的固定参数近似算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非对称扰动下的拟线性椭圆方程解的多重性研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

结构矩阵计算的扰动理论与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

提高移动最小二乘近似无网格方法计算效率的技术和理论

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员