Large Protein Language Models have shown strong potential for generative protein design, yet they frequently produce structural hallucinations, generating sequences with high linguistic likelihood that fold into thermodynamically unstable conformations. Existing alignment approaches such as Direct Preference Optimization are limited in this setting, as they model preferences as binary labels and ignore the continuous structure of the physical energy landscape. We propose Physio-DPO, a physics informed alignment framework that grounds protein language models in thermodynamic stability. Physio-DPO introduces a magnitude aware objective that scales optimization updates according to the energy gap between native structures and physics perturbed hard negatives. Experiments show that Physio-DPO consistently outperforms strong baselines including SFT, PPO, and standard DPO, reducing self consistency RMSD to 1.28 Å and increasing foldability to 92.8%. Qualitative analysis further demonstrates that Physio-DPO effectively mitigates structural hallucinations by recovering biophysical interactions such as hydrophobic core packing and hydrogen bond networks.


翻译:大型蛋白质语言模型在生成式蛋白质设计中展现出巨大潜力,但它们经常产生结构幻觉,即生成具有高语言似然性但折叠成热力学不稳定构象的序列。现有的对齐方法(如直接偏好优化)在此场景中存在局限,因为它们将偏好建模为二元标签,忽略了物理能量景观的连续结构。我们提出Physio-DPO,一种基于物理信息的对齐框架,将蛋白质语言模型锚定在热力学稳定性上。Physio-DPO引入了一种幅度感知目标函数,该函数根据天然结构与物理扰动的困难负样本之间的能量差来缩放优化更新。实验表明,Physio-DPO在包括SFT、PPO和标准DPO在内的多个强基线模型中均取得更优性能,将自洽性RMSD降低至1.28 Å,并将可折叠性提升至92.8%。定性分析进一步证明,Physio-DPO通过恢复诸如疏水核心堆积和氢键网络等生物物理相互作用,有效缓解了结构幻觉。

0
下载
关闭预览

相关内容

UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
14+阅读 · 2022年5月4日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员