Website Fingerprinting (WFP) has traditionally focused on inferring which website a user visits from encrypted traffic metadata such as packet sizes and timing. In this paper, we identify and quantify a new privacy risk in modern web settings: an adversary can infer a user's persona using only packet-length and inter-arrival-time sequences. To study this risk at scale, we build an LLM-driven multi-agent browsing framework that enforces controllable persona constraints while a computer-use agent interacts with real websites and collects corresponding encrypted traffic traces. We formalize persona fingerprinting under both closed-set and open-world settings and further evaluate whether persona information is already embedded in representations learned by existing WFP models and can be amplified at low cost. Across 10 modern websites and 15 personas (plus an open-world class), persona inference achieves about 84% accuracy on mixed-site traffic; moreover, a lightweight multi-task objective can boost persona accuracy to around 80% while retaining strong site classification performance (about 93% baseline). Our results show that, on modern websites, encrypted traffic metadata can leak not only which site a user visits, but also how they browse and who is browsing.


翻译:网站指纹识别(WFP)传统上侧重于通过加密流量元数据(如数据包大小和时序)推断用户访问的网站。本文识别并量化了现代网络环境中一种新的隐私风险:攻击者仅利用数据包长度和到达时间间隔序列即可推断用户的人格。为大规模研究该风险,我们构建了一个基于大语言模型(LLM)的多智能体浏览框架,在计算机使用智能体与真实网站交互并采集相应加密流量轨迹的过程中,强制执行可控的人格约束。我们在封闭集和开放世界两种场景下形式化定义了人格指纹识别,并进一步评估人格信息是否已嵌入现有WFP模型学习的表征中,以及是否可通过低成本方式被放大。在10个现代网站和15种人格(外加一个开放世界类别)的实验中,人格推断在混合站点流量上的准确率约为84%;此外,一个轻量级多任务目标可将人格准确率提升至约80%,同时保持较强的网站分类性能(基线约93%)。我们的结果表明,在现代网站上,加密流量元数据不仅可能泄露用户访问的网站,还可能泄露用户的浏览方式及身份。

0
下载
关闭预览

相关内容

《利用大型语言模型检测社交平台上的网络欺凌行为》
专知会员服务
45+阅读 · 2024年1月23日
专知会员服务
56+阅读 · 2020年12月28日
个性化推荐系统技术进展
专知会员服务
66+阅读 · 2020年8月15日
FaceNiff工具 - 适用于黑客的Android应用程序
黑白之道
151+阅读 · 2019年4月7日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
北大新技术:利用WiFi设备进行人体行为识别!
全球人工智能
12+阅读 · 2018年2月7日
人脸表情分类与识别:人脸检测+情绪分类
北京思腾合力科技有限公司
27+阅读 · 2017年12月18日
干货|基于双流递归神经网络的人体骨架行为识别!
全球人工智能
13+阅读 · 2017年12月15日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
2+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
6+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 6月17日
相关VIP内容
《利用大型语言模型检测社交平台上的网络欺凌行为》
专知会员服务
45+阅读 · 2024年1月23日
专知会员服务
56+阅读 · 2020年12月28日
个性化推荐系统技术进展
专知会员服务
66+阅读 · 2020年8月15日
相关资讯
FaceNiff工具 - 适用于黑客的Android应用程序
黑白之道
151+阅读 · 2019年4月7日
人脸检测库:libfacedetection
Python程序员
15+阅读 · 2019年3月22日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
北大新技术:利用WiFi设备进行人体行为识别!
全球人工智能
12+阅读 · 2018年2月7日
人脸表情分类与识别:人脸检测+情绪分类
北京思腾合力科技有限公司
27+阅读 · 2017年12月18日
干货|基于双流递归神经网络的人体骨架行为识别!
全球人工智能
13+阅读 · 2017年12月15日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员