We study the problem of counting $k$-hypergraphlets, an interesting but surprisingly ignored primitive, with the aim of understanding whether efficient algorithms exist. To this end, we consider color coding, a well-known technique for approximately counting $k$-graphlets in graphs. Our first result is that, on hypergraphs, color coding encounters a quadratic barrier: under the Orthogonal Vector Conjecture, no implementation can run in sub-quadratic time in the input size. We then introduce a simple property, $(α,β)$-niceness, that hypergraphs from real-world datasets appear to satisfy for small values of $α$ and $β$. Intuitively, an $(α,β)$-nice hypergraph can be split into two sub-hypergraphs having respectively rank at most $α$ and degree at most $β$. By applying different techniques to each sub-hypergraph and carefully combining the outputs, we show how to run color coding in time $2^{O(k)} \cdot (2^β|V| + α^k |E| + α^2 β\|H\|)$, where $H=(V,E)$ is the input hypergraph. Afterwards, we can sample colorful $k$-hypergraphlets uniformly in expected $k^{O(k)} \cdot (β^2 + \ln |V|)$ time per sample. Experiments on real-world hypergraphs show that our algorithm significantly outperforms the naive quadratic algorithm, sometimes by more than an order of magnitude.


翻译:我们研究$k$-超图小图样计数问题——一个有趣但令人惊讶地被忽视的基本问题,旨在理解是否存在高效算法。为此,我们考虑颜色编码这一在图结构中近似计数$k$-图小图样的著名技术。我们的首个结果表明,在超图上,颜色编码遭遇二次障碍:在正交向量猜想下,任何实现都无法在输入规模的次二次时间内运行。随后,我们引入一个简单性质——$(α,β)$-良性质——真实世界数据集中的超图对于较小的$α$和$β$值似乎满足该性质。直观上,一个$(α,β)$-良性超图可被分解为两个子超图,其秩(rank)分别不超过$α$,度(degree)分别不超过$β$。通过对每个子超图应用不同技术并仔细融合输出,我们展示了如何在$2^{O(k)} \cdot (2^β|V| + α^k |E| + α^2 β\|H\|)$时间内运行颜色编码(其中$H=(V,E)$为输入超图)。随后,我们能在期望$k^{O(k)} \cdot (β^2 + \ln |V|)$时间内均匀采样彩色$k$-超图小图样。在真实世界超图上的实验表明,我们的算法显著优于朴素二次算法,有时甚至提升超过一个数量级。

0
下载
关闭预览

相关内容

【新书】有趣的图算法:解码强大的算法,不再简化
专知会员服务
51+阅读 · 2024年10月2日
《图简化(Graph Reduction)》最新综述
专知会员服务
31+阅读 · 2024年2月10日
【2024新书】数据科学中的图算法:以Neo4j为例
专知会员服务
81+阅读 · 2024年1月19日
【2023新书】超图计算,Hypergraph Computation,251页pdf
专知会员服务
80+阅读 · 2023年5月29日
【干货书】算法图论,322页pdf
专知会员服务
85+阅读 · 2022年12月1日
【2022新书】图算法指南,A Guide to Graph Algorithms, 350页pdf
专知会员服务
84+阅读 · 2022年3月2日
【干货书】分数图论:对图论的一种理性的探讨,167页pdf
专知会员服务
26+阅读 · 2021年4月13日
【图计算】人工智能之图计算
产业智能官
17+阅读 · 2020年4月3日
图论、图算法与图学习
专知
29+阅读 · 2019年6月24日
基于深度学习的图像超分辨率最新进展与趋势【附PDF】
人工智能前沿讲习班
15+阅读 · 2019年2月27日
图卷积网络到底怎么做,这是一份极简的Numpy实现
综述:Image Caption 任务之语句多样性
PaperWeekly
22+阅读 · 2018年11月30日
针对初学者的图论速成
论智
11+阅读 · 2018年6月7日
实战 | 用Python做图像处理(二)
七月在线实验室
17+阅读 · 2018年5月25日
深度学习之图像超分辨重建技术
机器学习研究会
12+阅读 · 2018年3月24日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2011年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关资讯
【图计算】人工智能之图计算
产业智能官
17+阅读 · 2020年4月3日
图论、图算法与图学习
专知
29+阅读 · 2019年6月24日
基于深度学习的图像超分辨率最新进展与趋势【附PDF】
人工智能前沿讲习班
15+阅读 · 2019年2月27日
图卷积网络到底怎么做,这是一份极简的Numpy实现
综述:Image Caption 任务之语句多样性
PaperWeekly
22+阅读 · 2018年11月30日
针对初学者的图论速成
论智
11+阅读 · 2018年6月7日
实战 | 用Python做图像处理(二)
七月在线实验室
17+阅读 · 2018年5月25日
深度学习之图像超分辨重建技术
机器学习研究会
12+阅读 · 2018年3月24日
相关基金
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员