在这篇论文中,我们开发了具有理论保证的算法,以确保机器学习(ML)系统的可靠性与问责性。随着 ML 系统从预测模型演进为生成模型和自主智能体,可信 AI 的研究格局也发生了转变。本文提出了一系列基于信息论、优化理论和统计学习的工具,用于缓解偏见、减少任意性决策、确保内容来源可追溯性,并在自主场景中评估由 LLM 驱动的智能体。 为缓解传统 ML 模型中的偏见与任意性问题,我们提出了一种基于核方法的技术,以在复杂子群体上实现多重准确性,而这些子群体往往会被传统人口统计类别所忽略。我们还开发了应对预测多重性的方法;预测多重性指的是多个同样准确的模型却会对个体样本给出相互冲突的预测。 我们通过为大语言模型(LLM)设计水印机制来确保生成式 AI 的问责性。我们刻画了水印检测与文本失真之间的信息论权衡,并借助最优传输和编码理论推导出最优水印策略。实证评估表明,我们的水印方法在语言生成和代码生成任务中实现了更优的检测—质量权衡。 最后,我们通过首个完全由 LLM 驱动的供应链模拟器,在多智能体环境中评估自主 LLM 智能体。尽管这些智能体能够优于人类专家,最高可将成本降低 67%,但我们也识别出若干系统性风险,例如代价高昂的尾部事件。

成为VIP会员查看完整内容
7

相关内容

《关键任务型人工智能的可靠性》
专知会员服务
19+阅读 · 4月9日
【MIT博士论文】可靠机器学习模型部署,279页pdf
专知会员服务
56+阅读 · 2023年11月21日
最新《可解释人工智能》概述,50页ppt
专知
12+阅读 · 2021年3月17日
【综述】医疗可解释人工智能综述论文
专知
33+阅读 · 2019年7月18日
年度必读:2018最具突破性人工智能论文Top 10
机器学习算法与Python学习
11+阅读 · 2018年12月2日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2月23日
VIP会员
最新内容
Nature三连发AI自主科学发现论文
专知会员服务
0+阅读 · 今天14:19
安杜里尔与人工智能驱动防务的崛起
专知会员服务
10+阅读 · 今天8:08
《Palantir平台:FOUNDRY与AIP服务定义文档》
专知会员服务
9+阅读 · 今天7:45
2025年科学计算行业发展研究报告
专知会员服务
7+阅读 · 5月20日
《特种部队山地作战:一项战略要务》230页报告
相关基金
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员