Internet measurement faces twin challenges: complex analyses require expert-level orchestration of tools, yet even syntactically correct implementations can have methodological flaws and can be difficult to verify. Democratizing measurement capabilities thus demands automating both workflow generation and verification against methodological standards established through decades of research. We present Airavat, the first agentic framework for Internet measurement workflow generation with systematic verification and validation. Airavat coordinates a set of agents mirroring expert reasoning: three agents handle problem decomposition, solution design, and code implementation, with assistance from a registry of existing tools. Two specialized engines ensure methodological correctness: a Verification Engine evaluates workflows against a knowledge graph encoding five decades of measurement research, while a Validation Engine identifies appropriate validation techniques grounded in established methodologies. Through four Internet measurement case studies, we demonstrate that Airavat (i) generates workflows matching expert-level solutions, (ii) makes sound architectural decisions, (iii) addresses novel problems without ground truth, and (iv) identifies methodological flaws missed by standard execution-based testing.


翻译:互联网测量面临双重挑战:复杂的分析需要专家级的工具编排,然而即使是语法正确的实现也可能存在方法论缺陷且难以验证。因此,普及测量能力需要自动化工作流生成,并依据数十年研究建立的方法论标准进行验证。我们提出了Airavat,这是首个具备系统性验证与确认功能的、用于生成互联网测量工作流的智能体框架。Airavat协调一组模拟专家推理的智能体:三个智能体在现有工具注册库的辅助下,分别处理问题分解、方案设计和代码实现。两个专用引擎确保方法论正确性:验证引擎依据编码了五十年测量研究的知识图谱评估工作流;确认引擎则基于既定方法论识别合适的确认技术。通过四个互联网测量案例研究,我们证明Airavat能够(i)生成与专家级解决方案匹配的工作流,(ii)做出合理的架构决策,(iii)处理缺乏基准真值的新问题,以及(iv)发现标准基于执行的测试所遗漏的方法论缺陷。

0
下载
关闭预览

相关内容

互联网(英语:internet),是网络 与网络之间所串连成的庞大网络,这些网络以一组标准的网络TCP/IP协议族 相连,链接全世界几十亿个设备,形成逻辑上的单一巨大国际网络。这是一个网络的网络,它是由从地方到全球范围内几百万个私人的,学术界的,企业的和政府的网络所构成,通过电子,无线和光纤网络技术等等一系列广泛的技术联系在一起。这种将计算机网络互相联接在一起的方法可称作“网络互联”,在这基础上发展出覆盖全世界的全球性互联网络称互联网,即是互相连接一起的网络。
《用于战斗机实时飞行性能预测和评估的人工智能框架》
《人工智能赋能空战智能体的可解释性》
专知会员服务
69+阅读 · 2024年6月5日
自动驾驶毫米波雷达物体检测技术-算法
CVer
14+阅读 · 2020年5月10日
无人驾驶仿真软件
智能交通技术
22+阅读 · 2019年5月9日
PlaNet 简介:用于强化学习的深度规划网络
谷歌开发者
13+阅读 · 2019年3月16日
爱奇艺基于AI的移动端自动化测试框架的设计
前端之巅
18+阅读 · 2019年2月27日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
《用于战斗机实时飞行性能预测和评估的人工智能框架》
《人工智能赋能空战智能体的可解释性》
专知会员服务
69+阅读 · 2024年6月5日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员