Foundation models (FMs) unlock unprecedented multimodal and multitask intelligence, yet their cloud-centric deployment precludes real-time responsiveness and compromises user privacy. Meanwhile, monolithic execution at the edge remains infeasible under stringent resource limits and uncertain network dynamics. To bridge this gap, we propose a microservice-based FM inference framework that exploits the intrinsic functional asymmetry between heavyweight core services and agile light services. Our two-tier deployment strategy ensures robust Quality of Service (QoS) under resource contention. Specifically, core services are placed statically via a long-term network-aware integer program with sparsity constraints to form a fault-tolerant backbone. On the other hand, light services are orchestrated dynamically by a low-complexity online controller that integrates effective capacity theory with Lyapunov optimization, providing probabilistic latency guarantees under real-time workload fluctuations. Simulations demonstrate that our framework achieves over 84% average on-time task completion with moderate deployment costs and maintains strong robustness as the system load scales.


翻译:基础模型(FMs)开启了前所未有的多模态与多任务智能,但其以云为中心的部署方式阻碍了实时响应能力并损害了用户隐私。同时,在严格的资源限制和不确定的网络动态下,在边缘进行单体式执行仍然不可行。为弥合这一差距,我们提出了一种基于微服务的基础模型推理框架,该框架利用了重型核心服务与敏捷轻型服务之间固有的功能不对称性。我们的双层部署策略确保了在资源争用下鲁棒的服务质量(QoS)。具体而言,核心服务通过一个具有稀疏性约束的长期网络感知整数规划进行静态部署,以形成一个容错的骨干网络。另一方面,轻型服务由一个低复杂度的在线控制器动态编排,该控制器将有效容量理论与李雅普诺夫优化相结合,在实时工作负载波动下提供概率性延迟保证。仿真结果表明,我们的框架以适中的部署成本实现了超过84%的平均准时任务完成率,并在系统负载扩展时保持了强大的鲁棒性。

0
下载
关闭预览

相关内容

运用小型语言模型解锁战术边缘人工智能优势
专知会员服务
28+阅读 · 2025年9月7日
【CMU博士论文】利用信息论工具进行基础模型分析
专知会员服务
19+阅读 · 2025年8月31日
《面向边缘智能应用的AI模型优化技术研究》139页
专知会员服务
41+阅读 · 2025年8月12日
基于脉冲神经网络的边缘智能
专知会员服务
20+阅读 · 2025年7月23日
面向边缘智能的大模型研究进展
专知会员服务
40+阅读 · 2025年3月10日
《面向基础模型的高效参数微调》综述
专知会员服务
33+阅读 · 2025年1月24日
基础模型驱动的智能体服务部署:综述
专知会员服务
53+阅读 · 2024年12月19日
【斯坦福课程】基础模型进展
专知会员服务
52+阅读 · 2023年1月15日
【边缘计算】边缘计算面临的问题
产业智能官
17+阅读 · 2019年5月31日
用模型不确定性理解模型
论智
11+阅读 · 2018年9月5日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
推荐中的序列化建模:Session-based neural recommendation
机器学习研究会
18+阅读 · 2017年11月5日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
15+阅读 · 2017年5月19日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
VIP会员
相关VIP内容
运用小型语言模型解锁战术边缘人工智能优势
专知会员服务
28+阅读 · 2025年9月7日
【CMU博士论文】利用信息论工具进行基础模型分析
专知会员服务
19+阅读 · 2025年8月31日
《面向边缘智能应用的AI模型优化技术研究》139页
专知会员服务
41+阅读 · 2025年8月12日
基于脉冲神经网络的边缘智能
专知会员服务
20+阅读 · 2025年7月23日
面向边缘智能的大模型研究进展
专知会员服务
40+阅读 · 2025年3月10日
《面向基础模型的高效参数微调》综述
专知会员服务
33+阅读 · 2025年1月24日
基础模型驱动的智能体服务部署:综述
专知会员服务
53+阅读 · 2024年12月19日
【斯坦福课程】基础模型进展
专知会员服务
52+阅读 · 2023年1月15日
相关资讯
【边缘计算】边缘计算面临的问题
产业智能官
17+阅读 · 2019年5月31日
用模型不确定性理解模型
论智
11+阅读 · 2018年9月5日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
推荐中的序列化建模:Session-based neural recommendation
机器学习研究会
18+阅读 · 2017年11月5日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
15+阅读 · 2017年5月19日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员