Network datasets appear across a wide range of scientific fields, including biology, physics, and the social sciences. To enable data-driven discoveries from these networks, statistical inference techniques like estimation and hypothesis testing are crucial. However, the size of modern networks often exceeds the storage and computational capacities of existing methods, making timely, statistically rigorous inference difficult. In this work, we introduce a subsampling-based approach aimed at reducing the computational burden associated with estimation and two-sample hypothesis testing. Our strategy involves selecting a small random subset of nodes from the network, conducting inference on the resulting subgraph, and then using interpolation based on the observed connections between the subsample and the rest of the nodes to estimate the entire graph. We develop the methodology under the generalized random dot product graph framework, which affords broad applicability and permits rigorous analysis. Within this setting, we establish consistency guarantees and corroborate the practical effectiveness of the approach through comprehensive simulation studies.


翻译:网络数据集广泛存在于生物学、物理学和社会科学等多个科学领域。为了从这些网络中实现数据驱动的发现,诸如估计和假设检验等统计推断技术至关重要。然而,现代网络的规模常常超出了现有方法的存储和计算能力,使得及时且统计严谨的推断变得困难。在本工作中,我们提出了一种基于子采样的方法,旨在减轻与估计和双样本假设检验相关的计算负担。我们的策略包括从网络中选取一个小的随机节点子集,在生成的子图上进行推断,然后基于观测到的子样本与其余节点之间的连接关系进行插值,以估计整个图。我们在广义随机点积图框架下发展了该方法学,该框架提供了广泛的适用性并允许严格的分析。在此设定下,我们建立了理论一致性保证,并通过全面的模拟研究验证了该方法的实际有效性。

0
下载
关闭预览

相关内容

推荐系统中的扩散模型:综述
专知会员服务
21+阅读 · 2025年1月22日
ISWC2020最佳论文《可解释假信息检测的链接可信度评价》
深度学习模型可解释性的研究进展
专知
26+阅读 · 2020年8月1日
图神经网络最近这么火,不妨看看我们精选的这七篇
人工智能前沿讲习班
37+阅读 · 2018年12月10日
网络表示学习介绍
人工智能前沿讲习班
18+阅读 · 2018年11月26日
卷积神经网络的最佳解释!
专知
12+阅读 · 2018年5月1日
深度学习在CTR预估中的应用 | CTR深度模型大盘点
PaperWeekly
15+阅读 · 2018年4月11日
关系推理:基于表示学习和语义要素
计算机研究与发展
19+阅读 · 2017年8月22日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Arxiv
0+阅读 · 1月28日
VIP会员
相关VIP内容
推荐系统中的扩散模型:综述
专知会员服务
21+阅读 · 2025年1月22日
ISWC2020最佳论文《可解释假信息检测的链接可信度评价》
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员