To support the emergence of AI-as-a-Service (AIaaS), communication service providers (CSPs) are on the verge of a radical transformation-from pure connectivity providers to AIaaS a managed network service (control-and-orchestration plane that exposes AI models). In this model, the CSP is responsible not only for transport/communications, but also for intent-to-model resolution and joint network-compute orchestration, i.e., reliable and timely end-to-end delivery. The resulting end-to-end AIaaS service thus becomes governed by communications impairments (delay, loss) and inference impairments (latency, error). A central open problem is an operational AIaaS control-and-orchestration framework that enforces high fidelity, particularly under multi-domain federation. This paper introduces an assurance-oriented AIaaS management plane based on Tail-Risk Envelopes (TREs): signed, composable per-domain descriptors that combine deterministic guardrails with stochastic rate-latency-impairment models. Using stochastic network calculus, we derive bounds on end-to-end delay violation probabilities across tandem domains and obtain an optimization-ready risk-budget decomposition. We show that tenant-level reservations prevent bursty traffic from inflating tail latency under TRE contracts. An auditing layer then uses runtime telemetry to estimate extreme-percentile performance, quantify uncertainty, and attribute tail-risk to each domain for accountability. Packet-level Monte-Carlo simulations demonstrate improved p99.9 compliance under overload via admission control and robust tenant isolation under correlated burstiness.


翻译:为支持AI即服务(AIaaS)的兴起,通信服务提供商(CSP)正面临从纯连接提供商向AIaaS托管网络服务(即暴露AI模型的控制与编排平面)的根本性转型。在此模式下,CSP不仅需负责传输/通信,还需实现意图到模型的解析及网络-计算联合编排,即确保可靠且及时的端到端交付。由此产生的端到端AIaaS服务将同时受通信损伤(时延、丢包)与推理损伤(延迟、误差)的制约。当前的核心开放性问题在于如何构建可实施高保真保障的AIaaS控制与编排框架,尤其是在多域联邦场景下。本文提出一种基于尾部风险包络(TRE)的保障导向型AIaaS管理平面:TRE作为可签名、可组合的每域描述符,将确定性防护栏与随机速率-时延-损伤模型相结合。通过随机网络演算,我们推导了串联域间端到端时延违反概率的边界,并获得了可优化的风险预算分解方案。研究表明,在TRE合约下,租户级预留能防止突发流量导致尾部延迟膨胀。审计层随后利用运行时遥测数据估计极端百分位性能、量化不确定性,并将尾部风险归因至各域以实现责任追溯。分组级蒙特卡洛仿真表明,通过准入控制可在过载情况下提升p99.9合规性,并在相关突发流量下实现稳健的租户隔离。

0
下载
关闭预览

相关内容

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文,这些论文构成了整个领域的进步,也欢迎介绍人工智能应用的论文,但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能,而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案,强调其新颖性,并对正在开发的人工智能技术进行深入的评估。 官网地址:http://dblp.uni-trier.de/db/journals/ai/
AI 智能体系统:体系架构、应用场景及评估范式
智能体网络:用AI智能体编织下一代网络
专知会员服务
30+阅读 · 2025年8月5日
国防领域边缘计算:将智能推向行动前沿
专知会员服务
27+阅读 · 2025年4月6日
人工智能时代下的复杂网络
专知会员服务
51+阅读 · 2024年8月6日
面向AI大模型的智算中心网络演进白皮书,30页pdf
专知会员服务
84+阅读 · 2023年5月15日
《“边缘计算+”技术白皮书》,82页pdf
专知
11+阅读 · 2022年8月28日
重磅!AI框架发展白皮书(2022年),44页pdf
专知
28+阅读 · 2022年2月27日
完备的 AI 学习路线,最详细的资源整理!
新智元
17+阅读 · 2019年5月4日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
AI综述专栏 | 深度神经网络加速与压缩
人工智能前沿讲习班
31+阅读 · 2018年10月31日
AI综述专栏 | 跨领域推荐系统文献综述(上)
人工智能前沿讲习班
13+阅读 · 2018年5月16日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月12日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员