The lead marketing ecosystem enables collection, sale, and use of personal data submitted via web forms to deliver personalized quotes in high-value verticals such as insurance. Despite its scale and sensitivity of the collected data, this ecosystem remains largely unexplored by the research community. We present the first empirical study of privacy and spam risks in lead marketing, developing an end-to-end measurement framework to trace data flows from data collection to consumer contact. Our setup instruments over 100 health-related lead-generation websites and monitors 200 controlled phone numbers and email addresses to understand downstream marketing practices. We observe sharing of highly personal and sensitive health information to more than 70 distinct third parties on these lead generation websites. By purchasing our own and other organic leads from three major lead platforms, we uncover deceptive brokerage practices, where consumer data is sold to unvetted buyers and often augmented or fabricated with attributes such as health status and weight. We received a total of over 8,000 telemarketing phone calls, 600 text messages, and 200 emails, where calls often began within seconds of form submission. Many campaigns relied on VoIP-based neighbor spoofing and high-frequency dialing, at times rendering phones unusable. Our experiments with phone and email opt-outs suggest phone-based opt-outs to help the most, although all were ineffective at completely stopping marketing communications. Analysis of 7,432 Better Business Bureau (BBB) complaints and reviews corroborates these findings from the consumer perspective. Overall, our results reveal a highly interconnected and non-compliant lead marketing ecosystem that aggressively monetizes sensitive consumer data.


翻译:线索营销生态系统支持通过网页表单提交的个人数据收集、销售与使用,以便在保险等高价值垂直领域提供个性化报价。尽管该系统规模庞大且所收集数据具有敏感性,但研究界对其仍缺乏深入探索。我们首次对线索营销中的隐私与垃圾信息风险展开实证研究,开发了一套端到端测量框架,用于追踪从数据收集到消费者接触的全链路数据流动。我们的实验装置覆盖100余个健康相关线索生成网站,并通过监控200个受控电话号码与电子邮箱地址,以洞察下游营销实践。我们观察到,在这些线索生成网站上,高度个人化的敏感健康信息被共享给超过70个不同的第三方。通过从三大主要线索平台购买自身及其他自然生成的线索,我们发现了欺骗性的经纪行为:消费者数据被出售给未经审查的买家,且常被附加或编造健康状态、体重等属性。我们总计收到超过8000通电话营销来电、600条短信及200封电子邮件,其中部分来电在表单提交后数秒内即开始。许多营销活动依赖基于VoIP的邻居号码欺骗与高频拨号,有时导致手机无法正常使用。我们对电话与电子邮件退订机制的实验表明,电话退订的效果相对最佳,但所有方式均无法完全终止营销通讯。对7432条商业改进局(BBB)投诉与评价的分析进一步从消费者视角佐证了这些发现。总体而言,我们的研究结果揭示了一个高度互联且不合规的线索营销生态系统,该系统正以激进方式将敏感消费者数据货币化。

0
下载
关闭预览

相关内容

生成式推荐综述:数据、模型与任务
专知会员服务
19+阅读 · 2025年11月4日
多模态推荐系统综述:近期进展与未来方向
专知会员服务
38+阅读 · 2025年2月27日
对话推荐算法研究综述
专知会员服务
50+阅读 · 2022年2月18日
知识驱动的推荐系统:现状与展望
专知会员服务
69+阅读 · 2021年11月22日
【干货】20大推荐系统公共数据集分享
机器学习与推荐算法
68+阅读 · 2020年3月13日
推荐系统产品与算法概述 | 深度
AI100
11+阅读 · 2019年6月13日
快手类推荐系统实践
深度学习与NLP
25+阅读 · 2018年2月8日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
13+阅读 · 2017年9月22日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
27+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
VIP会员
相关主题
最新内容
认知战与交战性质的改变:神经战略视角
专知会员服务
5+阅读 · 5月8日
人工智能如何变革军事C5ISR作战
专知会员服务
12+阅读 · 5月8日
相关VIP内容
生成式推荐综述:数据、模型与任务
专知会员服务
19+阅读 · 2025年11月4日
多模态推荐系统综述:近期进展与未来方向
专知会员服务
38+阅读 · 2025年2月27日
对话推荐算法研究综述
专知会员服务
50+阅读 · 2022年2月18日
知识驱动的推荐系统:现状与展望
专知会员服务
69+阅读 · 2021年11月22日
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
27+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员