Making Models Unmergeable via Scaling-Sensitive Loss Landscape - 专知论文

会员服务 ·

0

缩放 · 损失 · 工具 · 合成 · 混合 ·

Making Models Unmergeable via Scaling-Sensitive Loss Landscape

翻译：基于缩放敏感损失景观的模型不可合并方法

Minwoo Jang,Hoyoung Kim,Jabin Koo,Jungseul Ok

from arxiv, Appears in ICML 2026

The rise of model hubs has made it easier to access reusable model components, making model merging a practical tool for combining capabilities. Yet, this modularity also creates a governance gap: downstream users can recompose released weights into unauthorized mixtures that bypass safety alignment or licensing terms. Because existing defenses are largely post-hoc and architecture-specific, they provide inconsistent protection across diverse architectures and release formats in practice. To close this gap, we propose Trap$^2$, an architecture-agnostic protection framework that encodes protection into updates during fine-tuning, regardless of whether they are released as adapters or full models. Instead of relying on architecture-dependent approaches, Trap$^2$ uses weight re-scaling as a simple proxy for the merging process. It keeps released weights effective in standalone use, but degrades them under re-scaling that often arises in merging, undermining unauthorized recomposition.

翻译：模型中心的兴起使得复用模型组件更加便捷，模型合并成为一项实用的能力整合工具。然而，这种模块化也带来了治理缺口：下游用户可将发布权重重新组合成未经授权的混合模型，从而绕过安全对齐或许可条款。由于现有防御措施多为事后补救且依赖特定架构，在实际应用中无法为不同架构和发布格式提供一致的保护。为弥补这一缺口，我们提出Trap$^2$，一种与架构无关的保护框架，可在微调过程中将保护机制编码到更新参数中，无论其以适配器还是完整模型形式发布。与依赖特定架构的方法不同，Trap$^2$将权重缩放作为合并过程的简单代理。该方法在独立使用场景下保持发布权重有效性，但在合并过程中常见的缩放操作下会使性能退化，从而阻止未经授权的模型重组。

0

相关内容

【博士论文】模型合并：理论基础与算法研究

【博士论文】模型合并：理论基础与算法研究

专知会员服务

15+阅读 · 5月7日

大语言模型时代下的模型合并：方法、应用与未来方向

大语言模型时代下的模型合并：方法、应用与未来方向

专知会员服务

14+阅读 · 3月11日

扩散模型中的缓存方法综述：迈向高效的多模态生成

扩散模型中的缓存方法综述：迈向高效的多模态生成

专知会员服务

9+阅读 · 2025年10月23日

《面相混合威胁建模的贝叶斯网络方法》最新报告

《面相混合威胁建模的贝叶斯网络方法》最新报告

专知会员服务

25+阅读 · 2025年7月30日

【CMU博士论文】在模型不准确的情况下实现可靠的基于模型的规划

【CMU博士论文】在模型不准确的情况下实现可靠的基于模型的规划

专知会员服务

19+阅读 · 2025年3月7日

《GPT 的困境：基础模型与双重用途的阴影——在人工智能时代驾驭民用与军用应用的模糊地带》最新30页论文

《GPT 的困境：基础模型与双重用途的阴影——在人工智能时代驾驭民用与军用应用的模糊地带》最新30页论文

专知会员服务

35+阅读 · 2024年8月16日

大模型报告:模型能力决定下限，场景适配度决定上限

大模型报告:模型能力决定下限，场景适配度决定上限

专知会员服务

57+阅读 · 2024年6月3日

低质量数据的多模态融合综述

低质量数据的多模态融合综述

专知会员服务

59+阅读 · 2024年5月4日

《大模型对齐方法》最新综述

《大模型对齐方法》最新综述

专知会员服务

85+阅读 · 2024年3月8日

《深度模型融合》综述

《深度模型融合》综述

专知会员服务

75+阅读 · 2023年9月28日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

专知

34+阅读 · 2022年10月26日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

如何理解模型的过拟合与欠拟合，以及如何解决？

如何理解模型的过拟合与欠拟合，以及如何解决？

七月在线实验室

12+阅读 · 2019年4月23日

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

AI前线

15+阅读 · 2019年3月21日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

基于随机不可靠量测的事件触发多传感器系统融合估计方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

支持新产品快速设计的复杂产品系统功能模块化方法

国家自然科学基金

1+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

不完备/冗余数据下复杂产品关联建模设计方法及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

不确定环境下产品配置与供应商选择集成优化方法

国家自然科学基金

1+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

From Refusal Geometry to Safety Geometry: Harmfulness--Refusal Coupling under Dynamic Adversarial Fine-Tuning

Arxiv

0+阅读 · 6月16日

Post-Hoc Merging is Not Enough: Many-Shot Model Merging with Loss-Gap Balancing

Arxiv

0+阅读 · 6月15日

Concrete Subspace Learning based Interference Elimination for Multi-task Model Fusion

Arxiv

0+阅读 · 6月14日

Insecurity Through Obscurity: Veiled Vulnerabilities in Closed-Source Contracts

Arxiv

0+阅读 · 6月10日

From Parameters to Feature Space: Task Arithmetic for Backdoor Mitigation in Model Merging

Arxiv

0+阅读 · 6月10日

Efficient Diffusion Models under Nonconvex Equality and Inequality constraints via Landing

Arxiv

0+阅读 · 5月31日

Attacks on Approximate Caches in Text-to-Image Diffusion Models

Arxiv

0+阅读 · 5月25日

ResiHP: Taming LLM Training Failures with Dynamic Hybrid Parallelism

Arxiv

0+阅读 · 5月11日

On the Essence and Prospect: An Investigation of Alignment Approaches for Big Models

Arxiv

18+阅读 · 2024年3月7日

Deep Model Fusion: A Survey

Arxiv

14+阅读 · 2023年9月27日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

【博士论文】模型合并：理论基础与算法研究

【博士论文】模型合并：理论基础与算法研究

专知会员服务

15+阅读 · 5月7日

大语言模型时代下的模型合并：方法、应用与未来方向

大语言模型时代下的模型合并：方法、应用与未来方向

专知会员服务

14+阅读 · 3月11日

扩散模型中的缓存方法综述：迈向高效的多模态生成

扩散模型中的缓存方法综述：迈向高效的多模态生成

专知会员服务

9+阅读 · 2025年10月23日

《面相混合威胁建模的贝叶斯网络方法》最新报告

《面相混合威胁建模的贝叶斯网络方法》最新报告

专知会员服务

25+阅读 · 2025年7月30日

【CMU博士论文】在模型不准确的情况下实现可靠的基于模型的规划

【CMU博士论文】在模型不准确的情况下实现可靠的基于模型的规划

专知会员服务

19+阅读 · 2025年3月7日

《GPT 的困境：基础模型与双重用途的阴影——在人工智能时代驾驭民用与军用应用的模糊地带》最新30页论文

《GPT 的困境：基础模型与双重用途的阴影——在人工智能时代驾驭民用与军用应用的模糊地带》最新30页论文

专知会员服务

35+阅读 · 2024年8月16日

大模型报告:模型能力决定下限，场景适配度决定上限

大模型报告:模型能力决定下限，场景适配度决定上限

专知会员服务

57+阅读 · 2024年6月3日

低质量数据的多模态融合综述

低质量数据的多模态融合综述

专知会员服务

59+阅读 · 2024年5月4日

《大模型对齐方法》最新综述

《大模型对齐方法》最新综述

专知会员服务

85+阅读 · 2024年3月8日

《深度模型融合》综述

《深度模型融合》综述

专知会员服务

75+阅读 · 2023年9月28日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

专知

34+阅读 · 2022年10月26日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

如何理解模型的过拟合与欠拟合，以及如何解决？

如何理解模型的过拟合与欠拟合，以及如何解决？

七月在线实验室

12+阅读 · 2019年4月23日

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

AI前线

15+阅读 · 2019年3月21日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

相关论文

From Refusal Geometry to Safety Geometry: Harmfulness--Refusal Coupling under Dynamic Adversarial Fine-Tuning

Arxiv

0+阅读 · 6月16日

Post-Hoc Merging is Not Enough: Many-Shot Model Merging with Loss-Gap Balancing

Arxiv

0+阅读 · 6月15日

Concrete Subspace Learning based Interference Elimination for Multi-task Model Fusion

Arxiv

0+阅读 · 6月14日

Insecurity Through Obscurity: Veiled Vulnerabilities in Closed-Source Contracts

Arxiv

0+阅读 · 6月10日

From Parameters to Feature Space: Task Arithmetic for Backdoor Mitigation in Model Merging

Arxiv

0+阅读 · 6月10日

Efficient Diffusion Models under Nonconvex Equality and Inequality constraints via Landing

Arxiv

0+阅读 · 5月31日

Attacks on Approximate Caches in Text-to-Image Diffusion Models

Arxiv

0+阅读 · 5月25日

ResiHP: Taming LLM Training Failures with Dynamic Hybrid Parallelism

Arxiv

0+阅读 · 5月11日

On the Essence and Prospect: An Investigation of Alignment Approaches for Big Models

Arxiv

18+阅读 · 2024年3月7日

Deep Model Fusion: A Survey

Arxiv

14+阅读 · 2023年9月27日

相关基金

基于随机不可靠量测的事件触发多传感器系统融合估计方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

支持新产品快速设计的复杂产品系统功能模块化方法

国家自然科学基金

1+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

不完备/冗余数据下复杂产品关联建模设计方法及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

不确定环境下产品配置与供应商选择集成优化方法

国家自然科学基金

1+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员