GenAI chatbots are now pervasive in digital ecosystems, fundamentally reshaping user interactions over the Internet. Their reliance on an always-online, cloud-centric operating model introduces novel traffic dynamics that challenge practical network management. Despite the critical need to anticipate these changes in network demand, the traffic characterization of these chatbots remains largely underexplored. To fill this gap, this study presents an in-depth traffic analysis of ChatGPT, Copilot, and Gemini used via Android mobile apps. Using a dedicated capture architecture, we collect two complementary datasets, combining unconstrained user interactions with a controlled workload of selected prompts for both text and image generation. This dual design allows us to address practical research questions on the distinctiveness of chatbot traffic, its divergence from that of conventional messaging apps, and its novel implications for network usage. To this end, we provide a multi-granular traffic characterization and model packet-sequence dynamics to uncover the underlying transmission mechanisms. Our analysis reveals app-/content-specific traffic patterns and distinctive protocol footprints. We highlight the predominance of TLS, with Gemini extensively leveraging QUIC, ChatGPT exclusively using TLS 1.3, and characteristic Server Name Indication (SNI) values. Through occlusion analysis, we quantify the reliance on SNI for traffic visibility, demonstrating that masking this field reduces classification performance by up to 20 percentage points. Finally, the comparison with conventional messaging apps confirms that GenAI workloads introduce novel stress factors, such as sustained upstream activity and high-rate bursts, with direct implications for capacity planning and network management. We publicly release the datasets to support reproducibility and foster extensions to other use cases.


翻译:生成式AI聊天机器人现已普及于数字生态系统,从根本上改变了用户通过互联网交互的方式。其依赖始终在线、云端核心的运行模式,引入了新型流量动态,给实际网络管理带来挑战。尽管迫切需要预测网络需求的变化,但这些聊天机器人的流量特征分析仍鲜有研究。为填补这一空白,本研究对通过安卓移动应用使用的ChatGPT、Copilot和Gemini进行了深入流量分析。通过专用捕获架构,我们收集了两组互补数据集,将无约束的用户交互与包含文本和图像生成选定提示词的可控工作负载相结合。这种双重设计使我们能够解决关于聊天机器人流量的独特性、其与传统即时通讯应用流量的差异,以及对网络使用产生的新影响的实证研究问题。为此,我们提供多粒度流量特征分析,并建模数据包序列动态以揭示底层传输机制。分析揭示了应用/内容特定的流量模式和独特的协议特征。我们强调了TLS的主导地位,其中Gemini广泛使用QUIC,ChatGPT仅使用TLS 1.3,并展示了典型服务器名称指示(SNI)值。通过遮挡分析,我们量化了SNI对流量可见性的依赖,证明屏蔽该字段会导致分类性能下降高达20个百分点。最后,与传统即时通讯应用的比较证实,生成式AI工作负载引入了新的压力因素,例如持续的上行活动和高速率突发,对容量规划和网络管理具有直接影响。我们公开发布数据集以支持可重复性,并促进向其他用例的扩展。

0
下载
关闭预览

相关内容

ChatGPT在军事中的潜在角色:根据ChatGPT的观点
专知会员服务
36+阅读 · 2025年1月1日
【ChatGPT系列报告】国内外大模型和AI应用梳理,40页ppt
专知会员服务
199+阅读 · 2023年5月22日
【ChatGPT系列报告】AIGC行业研究框架与投资逻辑,39页pdf
专知会员服务
67+阅读 · 2023年4月22日
【ChatGPT系列报告】算力、数据与模型综合分析,46页Slides
讲透RCNN, Fast-RCNN, Faster-RCNN,将CNN用于目标检测
数据挖掘入门与实战
18+阅读 · 2018年4月20日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
VIP会员
最新内容
网状网络及其在军事领域的运用
专知会员服务
4+阅读 · 今天6:18
无美国参与的欧洲战争方式(万字长文)
专知会员服务
4+阅读 · 今天5:54
《国防领域敏感性分析白皮书》
专知会员服务
5+阅读 · 今天3:42
综述 | 从问答到任务完成:Agent系统与Harness设计
Agentic RL:框架、实践与长程智能体训练
专知会员服务
4+阅读 · 6月24日
重新思考无人机时代的生存能力
专知会员服务
8+阅读 · 6月24日
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
6+阅读 · 6月24日
在人工智能加速决策环境中拓展OODA循环
专知会员服务
8+阅读 · 6月24日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员