Binary Flow Matching: Prediction-Loss Space Alignment for Robust Learning - 专知论文

会员服务 ·

0

Binary Flow Matching: Prediction-Loss Space Alignment for Robust Learning

翻译：二元流匹配：面向鲁棒学习的预测-损失空间对齐

Jiadong Hong,Lei Liu,Xinyu Bian,Wenjie Wang,Zhaoyang Zhang

from arxiv, 15 pages, 3 tables, 11 figures

Flow matching has emerged as a powerful framework for generative modeling, with recent empirical successes highlighting the effectiveness of signal-space prediction ($x$-prediction). In this work, we investigate the transfer of this paradigm to binary manifolds, a fundamental setting for generative modeling of discrete data. While $x$-prediction remains effective, we identify a latent structural mismatch that arises when it is coupled with velocity-based objectives ($v$-loss), leading to a time-dependent singular weighting that amplifies gradient sensitivity to approximation errors. Motivated by this observation, we formalize prediction-loss alignment as a necessary condition for flow matching training. We prove that re-aligning the objective to the signal space ($x$-loss) eliminates the singular weighting, yielding uniformly bounded gradients and enabling robust training under uniform timestep sampling without reliance on heuristic schedules. Finally, with alignment secured, we examine design choices specific to binary data, revealing a topology-dependent distinction between probabilistic objectives (e.g., cross-entropy) and geometric losses (e.g., mean squared error). Together, these results provide theoretical foundations and practical guidelines for robust flow matching on binary -- and related discrete -- domains, positioning signal-space alignment as a key principle for robust diffusion learning.

翻译：流匹配已成为生成建模的强大框架，近期实证成功凸显了信号空间预测（$x$-预测）的有效性。本文研究将该范式迁移至二元流形——离散数据生成建模的基础场景。尽管$x$-预测保持有效，我们识别出当其与基于速度的目标函数（$v$-损失）结合时产生的潜在结构失配，导致时变奇异加权现象，从而放大近似误差对梯度的敏感性。基于此观察，我们形式化地将预测-损失对齐定义为流匹配训练的必要条件。证明将目标函数重新对齐至信号空间（$x$-损失）可消除奇异加权，产生一致有界梯度，并实现在均匀时间步采样下无需依赖启发式调度策略的鲁棒训练。最后，在对齐得到保障的基础上，我们考察二元数据特有的设计选择，揭示概率型目标函数（如交叉熵）与几何型损失函数（如均方误差）之间依赖于拓扑结构的区别。这些结果共同为二元及相关的离散域上的鲁棒流匹配提供了理论基础与实践指南，将信号空间对齐定位为鲁棒扩散学习的关键原则。

0

相关内容

深度学习图像匹配：综述与展望

深度学习图像匹配：综述与展望

专知会员服务

18+阅读 · 2025年6月6日

【KDD2024】用于时空时间序列预测的异质性信息元参数学习

【KDD2024】用于时空时间序列预测的异质性信息元参数学习

专知会员服务

19+阅读 · 2024年5月20日

【KDD2023】基于强化动态对抗训练的鲁棒时空流量预测

【KDD2023】基于强化动态对抗训练的鲁棒时空流量预测

专知会员服务

28+阅读 · 2023年7月3日

【AAAI2023】基于时空自监督学习的交通流预测

【AAAI2023】基于时空自监督学习的交通流预测

专知会员服务

23+阅读 · 2022年12月10日

【ICML2022】基于对比学习的离线元强化学习的鲁棒任务表示

【ICML2022】基于对比学习的离线元强化学习的鲁棒任务表示

专知会员服务

17+阅读 · 2022年6月23日

【AAAI2021】时空融合图神经网络的交通流预测

专知会员服务

110+阅读 · 2020年12月22日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

超越三元组:基于超关系知识图谱嵌入的链接预测，Beyond Triplets: Hyper-Relational Knowledge Graph Embedding for Link Prediction

专知会员服务

78+阅读 · 2020年5月11日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

荐文 | 时序预测中的深度学习：以电力负载预测为例

荐文 | 时序预测中的深度学习：以电力负载预测为例

德先生

32+阅读 · 2019年9月18日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

数据分析

28+阅读 · 2019年5月23日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

量化投资与机器学习

25+阅读 · 2018年11月20日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于连续时间PWA模型的混杂系统预测控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知中正交匹配追踪算法的理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

几类随机指数函数空间的应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能交通的车联网时空数据流异常分析研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于时序相似性的机场噪声监测点交互预测

国家自然科学基金

1+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于2-D空间离散数据的质量与产出的预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视频图像处理的神经导航空间配准方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

Binomial flows: Denoising and flow matching for discrete ordinal data

Arxiv

0+阅读 · 5月1日

MedFlowSeg: Flow Matching for Medical Image Segmentation with Frequency-Aware Attention

Arxiv

0+阅读 · 4月21日

OFlow: Injecting Object-Aware Temporal Flow Matching for Robust Robotic Manipulation

Arxiv

0+阅读 · 4月20日

LeapAlign: Post-Training Flow Matching Models at Any Generation Step by Building Two-Step Trajectories

Arxiv

0+阅读 · 4月16日

Flow Matching is Adaptive to Manifold Structures

Arxiv

0+阅读 · 4月9日

On the minimax optimality of Flow Matching through the connection to kernel density estimation

Arxiv

0+阅读 · 3月17日

Distribution estimation via Flow Matching with Lipschitz guarantees

Arxiv

0+阅读 · 3月12日

What Does Flow Matching Bring To TD Learning?

Arxiv

0+阅读 · 3月4日

Active Flow Matching

Arxiv

0+阅读 · 3月1日

Physics vs Distributions: Pareto Optimal Flow Matching with Physics Constraints

Arxiv

0+阅读 · 2月23日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

深度学习图像匹配：综述与展望

深度学习图像匹配：综述与展望

专知会员服务

18+阅读 · 2025年6月6日

【KDD2024】用于时空时间序列预测的异质性信息元参数学习

【KDD2024】用于时空时间序列预测的异质性信息元参数学习

专知会员服务

19+阅读 · 2024年5月20日

【KDD2023】基于强化动态对抗训练的鲁棒时空流量预测

【KDD2023】基于强化动态对抗训练的鲁棒时空流量预测

专知会员服务

28+阅读 · 2023年7月3日

【AAAI2023】基于时空自监督学习的交通流预测

【AAAI2023】基于时空自监督学习的交通流预测

专知会员服务

23+阅读 · 2022年12月10日

【ICML2022】基于对比学习的离线元强化学习的鲁棒任务表示

【ICML2022】基于对比学习的离线元强化学习的鲁棒任务表示

专知会员服务

17+阅读 · 2022年6月23日

【AAAI2021】时空融合图神经网络的交通流预测

专知会员服务

110+阅读 · 2020年12月22日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

超越三元组:基于超关系知识图谱嵌入的链接预测，Beyond Triplets: Hyper-Relational Knowledge Graph Embedding for Link Prediction

专知会员服务

78+阅读 · 2020年5月11日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

荐文 | 时序预测中的深度学习：以电力负载预测为例

荐文 | 时序预测中的深度学习：以电力负载预测为例

德先生

32+阅读 · 2019年9月18日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

数据分析

28+阅读 · 2019年5月23日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

量化投资与机器学习

25+阅读 · 2018年11月20日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

相关论文

Binomial flows: Denoising and flow matching for discrete ordinal data

Arxiv

0+阅读 · 5月1日

MedFlowSeg: Flow Matching for Medical Image Segmentation with Frequency-Aware Attention

Arxiv

0+阅读 · 4月21日

OFlow: Injecting Object-Aware Temporal Flow Matching for Robust Robotic Manipulation

Arxiv

0+阅读 · 4月20日

LeapAlign: Post-Training Flow Matching Models at Any Generation Step by Building Two-Step Trajectories

Arxiv

0+阅读 · 4月16日

Flow Matching is Adaptive to Manifold Structures

Arxiv

0+阅读 · 4月9日

On the minimax optimality of Flow Matching through the connection to kernel density estimation

Arxiv

0+阅读 · 3月17日

Distribution estimation via Flow Matching with Lipschitz guarantees

Arxiv

0+阅读 · 3月12日

What Does Flow Matching Bring To TD Learning?

Arxiv

0+阅读 · 3月4日

Active Flow Matching

Arxiv

0+阅读 · 3月1日

Physics vs Distributions: Pareto Optimal Flow Matching with Physics Constraints

Arxiv

0+阅读 · 2月23日

相关基金

面向计算机视觉问题的图匹配算法研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于连续时间PWA模型的混杂系统预测控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知中正交匹配追踪算法的理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

几类随机指数函数空间的应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能交通的车联网时空数据流异常分析研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于时序相似性的机场噪声监测点交互预测

国家自然科学基金

1+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于2-D空间离散数据的质量与产出的预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视频图像处理的神经导航空间配准方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员