Emerging deployments of Generative AI increasingly execute inference across decentralized and heterogeneous edge devices rather than on a single trusted server. In such environments, a single device failure or misbehavior can disrupt the entire inference process, making traditional best-effort peer-to-peer routing insufficient. Coordinating distributed generative inference therefore requires mechanisms that explicitly account for reliability, performance variability, and trust among participating peers. In this paper, we present G-TRAC, a trust-aware coordination framework that integrates algorithmic path selection with system-level protocol design to ensure robust distributed inference. First, we formulate the routing problem as a \textit{Risk-Bounded Shortest Path} computation and introduce a polynomial-time solution that combines trust-floor pruning with Dijkstra's search, achieving sub-millisecond median routing latency at practical edge scales, and remaining below 10 ms at larger scales. Second, to operationally support the routing logic in dynamic environments, the framework employs a \textit{Hybrid Trust Architecture} that maintains global reputation state at stable anchors while disseminating lightweight updates to edge peers via background synchronization. Experimental evaluation on a heterogeneous testbed of commodity devices demonstrates that G-TRAC significantly improves inference completion rates, effectively isolates unreliable peers, and sustains robust execution even under node failures and network partitions.


翻译:新兴的生成式AI部署越来越多地依赖去中心化且异构的边缘设备执行推理,而非依赖单一的受信服务器。在此类环境中,单点设备故障或异常行为可能导致整个推理过程中断,使得传统的尽力而为型点对点路由策略难以胜任。协调分布式生成式推理因此需要显式考虑参与节点的可靠性、性能差异及信任度的机制。本文提出G-TRAC,一种融合算法路径选择与系统级协议设计以保障鲁棒分布式推理的信任感知协调框架。首先,我们将路由问题形式化为\textit{风险约束最短路径}计算,并提出一种结合信任基底剪枝与Dijkstra搜索的多项式时间解法,在实用边缘规模下实现亚毫秒级中位路由延迟,且在大规模场景下仍保持在10毫秒以内。其次,为在动态环境中支撑路由逻辑的运行时操作,该框架采用\textit{混合信任架构}:在稳定锚点维护全局信誉状态,同时通过后台同步机制向边缘节点传播轻量级更新。在异构商用设备实验床上的评估表明,G-TRAC显著提升了推理完成率,有效隔离了不可信节点,并能在节点失效与网络分区场景下维持鲁棒执行。

0
下载
关闭预览

相关内容

《面向边缘智能应用的AI模型优化技术研究》139页
专知会员服务
42+阅读 · 2025年8月12日
基于脉冲神经网络的边缘智能
专知会员服务
20+阅读 · 2025年7月23日
《人工智能辅助决策中信任的时间演化​​》225页
专知会员服务
24+阅读 · 2025年5月12日
《面向边缘AI应用的高性能高能效架构探索》156页
专知会员服务
35+阅读 · 2025年4月12日
国防领域边缘计算:将智能推向行动前沿
专知会员服务
28+阅读 · 2025年4月6日
【博士论文】边缘分布式深度神经网络推理
专知会员服务
27+阅读 · 2025年2月26日
边缘AI行业深度:边缘AI硬件,引领硬件创新时代
专知会员服务
51+阅读 · 2024年4月18日
《边缘计算通信安全威胁及计算任务分类》
专知会员服务
35+阅读 · 2023年11月13日
边缘智能研究进展
专知会员服务
80+阅读 · 2023年11月6日
《生成式人工智能的地缘政治》美国奥尔布赖特石桥集团
《“边缘计算+”技术白皮书》,82页pdf
专知
11+阅读 · 2022年8月28日
通过集成 XNNPACK 实现推理速度飞跃
TensorFlow
26+阅读 · 2020年7月30日
边缘智能发展与演进白皮书
物联网智库
13+阅读 · 2019年6月17日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
边缘计算应用:传感数据异常实时检测算法
计算机研究与发展
11+阅读 · 2018年4月10日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
VIP会员
最新内容
美国军方使用的10种反无人机武器(2026年更新)
专知会员服务
1+阅读 · 50分钟前
认知战与交战性质的改变:神经战略视角
专知会员服务
5+阅读 · 5月8日
相关VIP内容
《面向边缘智能应用的AI模型优化技术研究》139页
专知会员服务
42+阅读 · 2025年8月12日
基于脉冲神经网络的边缘智能
专知会员服务
20+阅读 · 2025年7月23日
《人工智能辅助决策中信任的时间演化​​》225页
专知会员服务
24+阅读 · 2025年5月12日
《面向边缘AI应用的高性能高能效架构探索》156页
专知会员服务
35+阅读 · 2025年4月12日
国防领域边缘计算:将智能推向行动前沿
专知会员服务
28+阅读 · 2025年4月6日
【博士论文】边缘分布式深度神经网络推理
专知会员服务
27+阅读 · 2025年2月26日
边缘AI行业深度:边缘AI硬件,引领硬件创新时代
专知会员服务
51+阅读 · 2024年4月18日
《边缘计算通信安全威胁及计算任务分类》
专知会员服务
35+阅读 · 2023年11月13日
边缘智能研究进展
专知会员服务
80+阅读 · 2023年11月6日
《生成式人工智能的地缘政治》美国奥尔布赖特石桥集团
相关资讯
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员