A/B testing is the foundation of decision-making in online platforms, yet social products often suffer from network interference: user interactions cause treatment effects to spill over into the control group. Such spillovers bias causal estimates and undermine experimental conclusions. Existing approaches face key limitations: user-level randomization ignores network structure, while cluster-based methods often rely on general-purpose clustering that is not tailored for spillover containment and has difficulty balancing unbiasedness and statistical power at scale. We propose a spillover-contained experimentation framework with two stages. In the pre-experiment stage, we build social interaction graphs and introduce a Balanced Louvain algorithm that produces stable, size-balanced clusters while minimizing cross-cluster edges, enabling reliable cluster-based randomization. In the post-experiment stage, we develop a tailored CUPAC estimator that leverages pre-experiment behavioral covariates to reduce the variance induced by cluster-level assignment, thereby improving statistical power. Together, these components provide both structural spillover containment and robust statistical inference. We validate our approach through large-scale social sharing experiments on Kuaishou, a platform serving hundreds of millions of users. Results show that our method substantially reduces spillover and yields more accurate assessments of social strategies than traditional user-level designs, establishing a reliable and scalable framework for networked A/B testing.


翻译:A/B测试是在线平台决策制定的基础,然而社交产品常受网络干扰影响:用户交互导致处理效应溢出至对照组。此类溢出效应会扭曲因果估计并削弱实验结论的有效性。现有方法存在关键局限:用户级随机化忽略网络结构,而基于聚类的方法通常依赖通用聚类算法,这些算法未针对溢出抑制进行专门设计,且难以在大规模场景下平衡无偏性与统计功效。我们提出一个包含两个阶段的溢出抑制实验框架。在实验前阶段,我们构建社交交互图并引入平衡Louvain算法,该算法在最小化跨聚类边连接的同时生成稳定且规模均衡的聚类,从而实现可靠的基于聚类的随机化。在实验后阶段,我们开发了定制化的CUPAC估计器,该估计器利用实验前行为协变量来降低由聚类级分配引起的方差,从而提升统计功效。这些组件共同提供了结构化的溢出抑制与鲁棒的统计推断能力。我们通过在服务数亿用户的快手平台上进行大规模社交分享实验来验证所提方法。结果表明,相较于传统的用户级设计方案,我们的方法能显著降低溢出效应,并对社交策略产生更精准的评估,从而为网络化A/B测试建立了可靠且可扩展的框架。

0
下载
关闭预览

相关内容

多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
可解释聚类综述
专知会员服务
38+阅读 · 2024年9月8日
【2023新书】实用A/B测试:创建实验驱动的产品,255页pdf
专知会员服务
35+阅读 · 2023年11月7日
《学习型系统的测试与评估》
专知会员服务
60+阅读 · 2023年3月12日
【WWW2021】通过异构GNN知识保留的增量社会事件检测
专知会员服务
22+阅读 · 2021年1月24日
【AAAI2021】对比聚类,Contrastive Clustering
专知
26+阅读 · 2021年1月30日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
AB实验在滴滴数据驱动中的应用
DataFunTalk
15+阅读 · 2020年5月31日
深度 | 推荐系统评估
AI100
24+阅读 · 2019年3月16日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员