We study extensions of the classic \emph{Line Cover} problem, which asks whether a set of $n$ points in the plane can be covered using $k$ lines. Line Cover is known to be NP-hard, and we focus on two natural generalizations. The first is \textbf{Line Clustering}, where the goal is to find $k$ lines minimizing the sum of squared distances from the input points to their nearest line. The second is \textbf{Hyperplane Cover}, which asks whether $n$ points in $\mathbb{R}^d$ can be covered by $k$ hyperplanes. We also study the more general \textbf{Projective Clustering} problem, which unifies both settings and has applications in machine learning, data analysis, and computational geometry. In this problem, one seeks $k$ affine subspaces of dimension $r$ that minimize the sum of squared distances from the given points in $\mathbb{R}^d$ to the nearest subspace. Our results reveal notable differences in the parameterized complexity of these problems. While Line Cover is fixed-parameter tractable when parameterized by $k$, we show that Line Clustering is W[1]-hard with respect to $k$ and does not admit an algorithm with running time $n^{o(k)}$ unless the Exponential Time Hypothesis fails. Hyperplane Cover has been known to be NP-hard since the 1980s, following work of Megiddo and Tamir, even for $d=2$, we show that it remains NP-hard even when $k=2$. Finally, we present an algorithm for Projective Clustering running in $n^{O(dk(r+1))}$ time. This bound matches our lower bound for Line Clustering and generalizes the classic algorithm for $k$-Means Clustering ($r=0$) by Inaba, Katoh, and Imai [SoCG 1994].


翻译:我们研究经典《直线覆盖》问题的扩展,该问题询问平面上的 $n$ 个点是否能被 $k$ 条直线覆盖。已知直线覆盖问题是NP难的,我们聚焦于其两种自然推广。第一种是《直线聚类》,目标是找到 $k$ 条直线,最小化输入点到其最近直线的平方距离之和。第二种是《超平面覆盖》,询问 $\mathbb{R}^d$ 中的 $n$ 个点是否能被 $k$ 个超平面覆盖。我们还研究了更一般的《投影聚类》问题,该问题统一了上述两种设定,并在机器学习、数据分析和计算几何中有应用。在此问题中,我们需要寻找 $k$ 个维度为 $r$ 的仿射子空间,以最小化 $\mathbb{R}^d$ 中给定点到最近子空间的平方距离之和。我们的结果揭示了这些问题在参数化复杂度上的显著差异。虽然当以 $k$ 为参数时直线覆盖是固定参数可解的,但我们证明直线聚类关于 $k$ 是 W[1] 难的,并且除非指数时间假设不成立,否则不存在时间复杂度为 $n^{o(k)}$ 的算法。超平面覆盖自20世纪80年代以来(继Megiddo和Tamir的工作之后)已知是NP难的,即使对于 $d=2$ 也是如此;我们证明即使当 $k=2$ 时它仍然是NP难的。最后,我们提出一种时间复杂度为 $n^{O(dk(r+1))}$ 的投影聚类算法。该界匹配了我们对直线聚类的下界,并推广了Inaba、Katoh和Imai [SoCG 1994] 关于 $k$ 均值聚类($r=0$)的经典算法。

0
下载
关闭预览

相关内容

《军事选址集合覆盖干扰问题》109页
专知会员服务
19+阅读 · 2月20日
【新书】线性代数 II:应用的高级主题
专知会员服务
45+阅读 · 2024年8月22日
【干货书】线性代数理论与应用,412页pdf
专知会员服务
66+阅读 · 2023年2月12日
和积网络综述论文,Sum-product networks: A survey,24页pdf
专知会员服务
24+阅读 · 2020年4月3日
视线估计(Gaze Estimation)简介(一):概述
CVer
10+阅读 · 2020年3月18日
一文读懂线性回归、岭回归和Lasso回归
CSDN
34+阅读 · 2019年10月13日
一文读懂背包问题(附经典例题详解)
九章算法
12+阅读 · 2019年6月12日
【边缘计算】边缘计算面临的问题
产业智能官
17+阅读 · 2019年5月31日
线性回归:简单线性回归详解
专知
12+阅读 · 2018年3月10日
图上的归纳表示学习
科技创新与创业
23+阅读 · 2017年11月9日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 3月23日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
4+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
4+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员