Demystifying Mergeability: Interpretable Properties to Predict Model Merging Success

Model merging combines knowledge from separately fine-tuned models, yet success factors remain poorly understood. While recent work treats mergeability as an intrinsic property, we show with an architecture-agnostic framework that it fundamentally depends on both the merging method and the partner tasks. Using linear optimization over a set of interpretable pairwise metrics (e.g., gradient L2 distance), we uncover properties correlating with post-merge performance across four merging methods. We find substantial variation in success drivers (46.7% metric overlap; 55.3% sign agreement), revealing method-specific "fingerprints". Crucially, however, subspace overlap and gradient alignment metrics consistently emerge as foundational, method-agnostic prerequisites for compatibility. These findings provide a diagnostic foundation for understanding mergeability and motivate future fine-tuning strategies that explicitly encourage these properties.

翻译：模型合并技术旨在整合来自独立微调模型的知识，然而其成功的关键因素至今仍未得到充分理解。尽管近期研究将可合并性视为模型的内在属性，我们通过一个与架构无关的框架证明：该属性本质上同时取决于合并方法与目标任务对。基于一组可解释的成对度量指标（如梯度L2距离）进行线性优化分析，我们发现了与四种合并方法在合并后性能均存在关联的共性属性。研究发现不同方法间的成功驱动因素存在显著差异（度量指标重叠率46.7%；符号一致性55.3%），揭示了具有方法特异性的“指纹特征”。然而至关重要的是，子空间重叠度与梯度对齐度指标始终作为兼容性的基础性、方法无关的前提条件而显现。这些发现为理解模型可合并性提供了诊断基础，并激励未来开发能显式促进这些属性的微调策略。

相关内容

属性

关注 1

一个具体事物，总是有许许多多的性质与关系，我们把一个事物的性质与关系，都叫作事物的属性。事物与属性是不可分的，事物都是有属性的事物，属性也都是事物的属性。一个事物与另一个事物的相同或相异，也就是一个事物的属性与另一事物的属性的相同或相异。由于事物属性的相同或相异，客观世界中就形成了许多不同的事物类。具有相同属性的事物就形成一类，具有不同属性的事物就分别地形成不同的类。

大语言模型时代下的模型合并：方法、应用与未来方向

专知会员服务

14+阅读 · 3月11日

在大语言模型（LLM）、多模态大语言模型（MLLM）及其他领域中的模型融合：方法、理论、应用与机遇

专知会员服务

63+阅读 · 2024年8月15日

《深度模型融合》综述

专知会员服务

75+阅读 · 2023年9月28日

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日