Permutation Matching Under Parikh Budgets: Linear-Time Detection, Packing, and Disjoint Selection - 专知论文

会员服务 ·

0

置换 · 算法 · 滑动窗口 · 可行 · 乱序 ·

Permutation Matching Under Parikh Budgets: Linear-Time Detection, Packing, and Disjoint Selection

翻译：基于帕里赫预算的置换匹配：线性时间检测、打包与不相交选择

MD Nazmul Alam Shanto,Md. Tanzeem Rahat,Md. Manzurul Hasan

from arxiv, 12 pages (Excluding reference)

We study permutation (jumbled/Abelian) pattern matching over a general alphabet $Σ$. Given a pattern P of length m and a text T of length n, the classical task is to decide whether T contains a length-m substring whose Parikh vector equals that of P . While this existence problem admits a linear-time sliding-window solution, many practical applications require optimization and packing variants beyond mere detection. We present a unified sliding-window framework based on maintaining the Parikh-vector difference between P and the current window of T , enabling permutation matching in O(n + σ) time and O(σ) space, where σ = |Σ|. Building on this foundation, we introduce a combinatorial-optimization variant that we call Maximum Feasible Substring under Pattern Supply (MFSP): find the longest substring S of T whose symbol counts are component-wise bounded by those of P . We show that MFSP can also be solved in O(n + σ) time via a two-pointer feasibility maintenance algorithm, providing an exact packing interpretation of P as a resource budget. Finally, we address non-overlapping occurrence selection by modeling each permutation match as an equal-length interval and proving that a greedy earliest-finishing strategy yields a maximum-cardinality set of disjoint matches, computable in linear time once all matches are enumerated. Our results provide concise, provably correct algorithms with tight bounds, and connect frequency-based string matching to packing-style optimization primitives.

翻译：我们研究一般字母表$Σ$上的置换（乱序/阿贝尔）模式匹配问题。给定长度为$m$的模式$P$和长度为$n$的文本$T$，经典任务是判断$T$是否包含一个长度为$m$的子串，其帕里赫向量与$P$相等。虽然该存在性问题可通过线性时间滑动窗口算法求解，但许多实际应用需要超越单纯检测的优化与打包变体。我们提出一种基于维护$P$与$T$当前窗口间帕里赫向量差的统一滑动窗口框架，可在$O(n + σ)$时间和$O(σ)$空间内实现置换匹配，其中$σ = |Σ|$。在此基础上，我们引入一种组合优化变体——模式供给下的最大可行子串问题：寻找$T$中最长的子串$S$，其符号计数在分量意义上不超过$P$的对应计数。我们证明MFSP问题同样可通过双指针可行性维护算法在$O(n + σ)$时间内求解，为$P$提供了作为资源预算的精确打包解释。最后，我们通过将每个置换匹配建模为等长区间，并证明贪心最早结束策略可得到最大基数的不相交匹配集合，从而解决非重叠出现选择问题，该集合可在枚举所有匹配后线性时间内计算。我们的结果提供了具有紧致界限的简洁可证明正确算法，并将基于频率的字符串匹配与打包式优化原语联系起来。

0

相关内容

【牛津大学博士论文】基于数据驱动的金融时间序列模拟和预测方法，238页pdf

【牛津大学博士论文】基于数据驱动的金融时间序列模拟和预测方法，238页pdf

专知会员服务

62+阅读 · 2023年9月4日

【CVPR 2022】基于粗粒度和细粒度特征匹配的视频描述评估，EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained Embedding Matching

【CVPR 2022】基于粗粒度和细粒度特征匹配的视频描述评估，EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained Embedding Matching

专知会员服务

10+阅读 · 2022年3月19日

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

专知会员服务

43+阅读 · 2021年11月12日

【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索

【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索

专知会员服务

14+阅读 · 2021年2月25日

【AAAI2021】基于图神经网络的文本语义匹配算法

【AAAI2021】基于图神经网络的文本语义匹配算法

专知会员服务

50+阅读 · 2021年1月30日

李航等最新《搜索与推荐中的深度学习匹配》新书，190页pdf

李航等最新《搜索与推荐中的深度学习匹配》新书，190页pdf

专知会员服务

208+阅读 · 2020年9月6日

超越三元组:基于超关系知识图谱嵌入的链接预测，Beyond Triplets: Hyper-Relational Knowledge Graph Embedding for Link Prediction

专知会员服务

78+阅读 · 2020年5月11日

【AAAI2020】Context-Transformer:上下文转换器:解决对象混淆的小样本检测，Context-Transformer: Tackling Object Confusion for Few-Shot Detection

【AAAI2020】Context-Transformer:上下文转换器:解决对象混淆的小样本检测，Context-Transformer: Tackling Object Confusion for Few-Shot Detection

专知会员服务

51+阅读 · 2020年3月17日

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

专知会员服务

30+阅读 · 2020年1月11日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知会员服务

75+阅读 · 2019年10月19日

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

中国科学院网络数据重点实验室

16+阅读 · 2019年8月26日

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

数据分析

28+阅读 · 2019年5月23日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

利用动态深度学习预测金融时间序列基于Python

利用动态深度学习预测金融时间序列基于Python

量化投资与机器学习

18+阅读 · 2018年10月30日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

用PyTorch实现各种GANs（附论文和代码地址）

用PyTorch实现各种GANs（附论文和代码地址）

论智

23+阅读 · 2018年4月24日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

如何在Python中用LSTM网络进行时间序列预测

如何在Python中用LSTM网络进行时间序列预测

AI100

17+阅读 · 2017年8月5日

求解时间依赖问题的隐式时空并行 Schwarz 算法研究

国家自然科学基金

0+阅读 · 2017年12月31日

考虑时段费用的生产外包集成排序和协调机制设计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

线性互补约束二次规划问题的一个全局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

混沌时间序列Volterra建模及其在语音信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

切换系统的容错保成本和容错H无穷控制

国家自然科学基金

0+阅读 · 2015年12月31日

套代数框架下时变线性系统的同时稳定化

国家自然科学基金

0+阅读 · 2015年12月31日

外包与云计算情境下IT业务匹配研究：适应性结构化理论视角

国家自然科学基金

2+阅读 · 2014年12月31日

Hardness of Regular Expression Matching with Extensions

Arxiv

0+阅读 · 2月18日

Erdős Matching (Conjecture) Theorem

Arxiv

0+阅读 · 2月14日

Time-Optimal Construction of String Synchronizing Sets

Arxiv

0+阅读 · 2月11日

Binary Flow Matching: Prediction-Loss Space Alignment for Robust Learning

Arxiv

0+阅读 · 2月11日

Approximate Cartesian Tree Matching with Substitutions

Arxiv

0+阅读 · 2月9日

Erdős Matching (Conjecture) Theorem

Arxiv

0+阅读 · 2月4日

Group Permutation Testing in Linear Model: Sharp Validity, Power Improvement, and Extension Beyond Exchangeability

Arxiv

0+阅读 · 1月25日

Tensor Reed-Muller Codes: Achieving Capacity with Quasilinear Decoding Time

Arxiv

0+阅读 · 1月22日

The Longest Common Bitonic Subsequence: A Match-Sensitive Dynamic Programming Approach

Arxiv

0+阅读 · 1月14日

Dynamic Pattern Matching with Wildcards

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

2+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

4+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

5+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

6+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

10+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

13+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

【牛津大学博士论文】基于数据驱动的金融时间序列模拟和预测方法，238页pdf

【牛津大学博士论文】基于数据驱动的金融时间序列模拟和预测方法，238页pdf

专知会员服务

62+阅读 · 2023年9月4日

【CVPR 2022】基于粗粒度和细粒度特征匹配的视频描述评估，EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained Embedding Matching

【CVPR 2022】基于粗粒度和细粒度特征匹配的视频描述评估，EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained Embedding Matching

专知会员服务

10+阅读 · 2022年3月19日

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

NeurIPS 2021 | 微观特征混合进行宏观时间序列预测

专知会员服务

43+阅读 · 2021年11月12日

【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索

【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索

专知会员服务

14+阅读 · 2021年2月25日

【AAAI2021】基于图神经网络的文本语义匹配算法

【AAAI2021】基于图神经网络的文本语义匹配算法

专知会员服务

50+阅读 · 2021年1月30日

李航等最新《搜索与推荐中的深度学习匹配》新书，190页pdf

李航等最新《搜索与推荐中的深度学习匹配》新书，190页pdf

专知会员服务

208+阅读 · 2020年9月6日

超越三元组:基于超关系知识图谱嵌入的链接预测，Beyond Triplets: Hyper-Relational Knowledge Graph Embedding for Link Prediction

专知会员服务

78+阅读 · 2020年5月11日

【AAAI2020】Context-Transformer:上下文转换器:解决对象混淆的小样本检测，Context-Transformer: Tackling Object Confusion for Few-Shot Detection

【AAAI2020】Context-Transformer:上下文转换器:解决对象混淆的小样本检测，Context-Transformer: Tackling Object Confusion for Few-Shot Detection

专知会员服务

51+阅读 · 2020年3月17日

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

专知会员服务

30+阅读 · 2020年1月11日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知会员服务

75+阅读 · 2019年10月19日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

中国科学院网络数据重点实验室

16+阅读 · 2019年8月26日

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

数据分析

28+阅读 · 2019年5月23日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

利用动态深度学习预测金融时间序列基于Python

利用动态深度学习预测金融时间序列基于Python

量化投资与机器学习

18+阅读 · 2018年10月30日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

用PyTorch实现各种GANs（附论文和代码地址）

用PyTorch实现各种GANs（附论文和代码地址）

论智

23+阅读 · 2018年4月24日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

如何在Python中用LSTM网络进行时间序列预测

如何在Python中用LSTM网络进行时间序列预测

AI100

17+阅读 · 2017年8月5日

相关论文

Hardness of Regular Expression Matching with Extensions

Arxiv

0+阅读 · 2月18日

Erdős Matching (Conjecture) Theorem

Arxiv

0+阅读 · 2月14日

Time-Optimal Construction of String Synchronizing Sets

Arxiv

0+阅读 · 2月11日

Binary Flow Matching: Prediction-Loss Space Alignment for Robust Learning

Arxiv

0+阅读 · 2月11日

Approximate Cartesian Tree Matching with Substitutions

Arxiv

0+阅读 · 2月9日

Erdős Matching (Conjecture) Theorem

Arxiv

0+阅读 · 2月4日

Group Permutation Testing in Linear Model: Sharp Validity, Power Improvement, and Extension Beyond Exchangeability

Arxiv

0+阅读 · 1月25日

Tensor Reed-Muller Codes: Achieving Capacity with Quasilinear Decoding Time

Arxiv

0+阅读 · 1月22日

The Longest Common Bitonic Subsequence: A Match-Sensitive Dynamic Programming Approach

Arxiv

0+阅读 · 1月14日

Dynamic Pattern Matching with Wildcards

Arxiv

0+阅读 · 1月14日

相关基金

求解时间依赖问题的隐式时空并行 Schwarz 算法研究

国家自然科学基金

0+阅读 · 2017年12月31日

考虑时段费用的生产外包集成排序和协调机制设计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

线性互补约束二次规划问题的一个全局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

混沌时间序列Volterra建模及其在语音信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

切换系统的容错保成本和容错H无穷控制

国家自然科学基金

0+阅读 · 2015年12月31日

套代数框架下时变线性系统的同时稳定化

国家自然科学基金

0+阅读 · 2015年12月31日

外包与云计算情境下IT业务匹配研究：适应性结构化理论视角

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员