In \emph{Online Sorting}, an array of $n$ initially empty cells is given. At each time step $t$, an element $x_t \in [0,1]$ arrives and must be placed irrevocably into an empty cell without any knowledge of future arrivals. We aim to minimize the sum of absolute differences between pairs of elements placed in consecutive array cells, seeking an online placement strategy that results in a final array close to a sorted one. An interesting multidimensional generalization, a.k.a. the \emph{Online Travelling Salesperson Problem}, arises when the request sequence consists of points in the $d$-dimensional unit cube and the objective is to minimize the sum of euclidean distances between points in consecutive cells. Motivated by the recent work of (Abrahamsen, Bercea, Beretta, Klausen and Kozma; ESA 2024), we consider the \emph{stochastic version} of Online Sorting (\textit{resp.} Online TSP), where each element (\textit{resp.} point) $x_t$ is an i.i.d. sample from the uniform distribution on $[0, 1]$ (\textit{resp.} $[0,1]^d$). By carefully decomposing the request sequence into a hierarchy of balls-into-bins instances, where the balls to bins ratio is large enough so that bin occupancy is sharply concentrated around its mean and small enough so that we can efficiently deal with the elements placed in the same bin, we obtain an online algorithm that approximates the optimal cost within a factor of $O(\log^2 n)$ with high probability. Our result comprises an exponential improvement on the previously best known competitive ratio of $\tilde{O}(n^{1/4})$ for Stochastic Online Sorting due to (Abrahamsen et al.; ESA 2024) and $O(\sqrt{n})$ for (adversarial) Online TSP due to (Bertram, ESA 2025).


翻译:在\emph{在线排序}问题中,给定一个包含$n$个初始为空单元的数组。在每个时间步$t$,元素$x_t \in [0,1]$到达且必须被不可撤销地放置到一个空单元中,且无法预知未来到达的元素。我们的目标是最小化放置在连续数组单元中的元素对之间的绝对差值之和,从而寻求一种在线放置策略,使得最终数组接近排序状态。一个有趣的多维推广(即\emph{在线旅行商问题})出现在请求序列由$d$维单位立方体中的点构成时,其目标是最小化连续单元中点之间的欧几里得距离之和。受(Abrahamsen, Bercea, Beretta, Klausen and Kozma; ESA 2024)近期工作的启发,我们考虑在线排序(\textit{相应地}在线TSP)的\emph{随机版本},其中每个元素(\textit{相应地}点)$x_t$是从$[0, 1]$(\textit{相应地}$[0,1]^d$)上的均匀分布中独立同分布抽取的样本。通过将请求序列仔细分解为一系列球入箱实例的层次结构(其中球与箱的比例足够大使箱的占用率高度集中于其均值附近,同时又足够小使得我们能高效处理放置在同一箱中的元素),我们得到一种在线算法,能以高概率在$O(\log^2 n)$因子内逼近最优成本。我们的结果相较于先前已知的最佳竞争比实现了指数级改进:针对随机在线排序的$\tilde{O}(n^{1/4})$(Abrahamsen等人; ESA 2024)以及针对(对抗性)在线TSP的$O(\sqrt{n})$(Bertram, ESA 2025)。

0
下载
关闭预览

相关内容

【博士论文】电商搜索中的排序学习
专知会员服务
13+阅读 · 2025年11月15日
Meta-Transformer:多模态学习的统一框架
专知会员服务
59+阅读 · 2023年7月21日
具有组合结构的统计推断和在线算法
专知会员服务
12+阅读 · 2022年12月13日
【清华大学】图随机神经网络,Graph Random Neural Networks
专知会员服务
156+阅读 · 2020年5月26日
从信息瓶颈理论一瞥机器学习的“大一统理论”
Seq2seq强化,Pointer Network简介
机器学习算法与Python学习
15+阅读 · 2018年12月8日
R语言之数据分析高级方法「时间序列」
R语言中文社区
17+阅读 · 2018年4月24日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月9日
VIP会员
相关VIP内容
【博士论文】电商搜索中的排序学习
专知会员服务
13+阅读 · 2025年11月15日
Meta-Transformer:多模态学习的统一框架
专知会员服务
59+阅读 · 2023年7月21日
具有组合结构的统计推断和在线算法
专知会员服务
12+阅读 · 2022年12月13日
【清华大学】图随机神经网络,Graph Random Neural Networks
专知会员服务
156+阅读 · 2020年5月26日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员