Measuring Biological Capabilities and Risks of AI Agents - 专知论文

会员服务 ·

0

AI · Agent · 设计 · AI Agent · Performer ·

Measuring Biological Capabilities and Risks of AI Agents

翻译：暂无翻译

Patricia Paskov,Jeffrey Lee,Kyle Brady,Alyssa Worland

This paper addresses a rapidly emerging policy challenge: how to generate and interpret credible evidence about the biological capabilities and risks of AI scientists, or agentic AI systems capable of autonomously or collaboratively performing multi-step scientific tasks. As these systems enter real research workflows, decision-makers increasingly face evaluation results whose meaning depends on underlying design choices that are often implicit or under-documented. We synthesize current evidence on AI-enabled biological risks and introduce biological agentic evaluations as a promising, but interpretation-sensitive, tool for assessing these systems. Our central contribution is a set of practical, experience-grounded considerations -- drawing from our own evaluations -- that show how choices around defining, designing, running, scoring, and documenting evaluations materially shape what results do and do not imply about risk. The analysis is intended to help policymakers interpret biological evaluation outputs with appropriate caution; guide public and private funders toward high-leverage investments in AI-biology evaluation research; and support biosecurity practitioners assessing emerging AI systems. A secondary audience includes researchers designing or conducting agentic evaluations within frontier AI labs, AI providers, scientific institutions, and third-party evaluation organizations.

翻译：暂无翻译

0

相关内容

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文，这些论文构成了整个领域的进步，也欢迎介绍人工智能应用的论文，但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能，而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案，强调其新颖性，并对正在开发的人工智能技术进行深入的评估。官网地址：http://dblp.uni-trier.de/db/journals/ai/

从Idea构想到论文发表：AI for Research全链路综述与实践

从Idea构想到论文发表：AI for Research全链路综述与实践

专知会员服务

24+阅读 · 2025年7月21日

《人工智能武器化：恐怖主义与战争的新阶段》2025最新134页

《人工智能武器化：恐怖主义与战争的新阶段》2025最新134页

专知会员服务

26+阅读 · 2025年5月3日

Nature Methods主题特刊：关注 AI 在生物学中的应用

Nature Methods主题特刊：关注 AI 在生物学中的应用

专知会员服务

18+阅读 · 2024年8月17日

Nat. Biotechnol. | 用机器学习预测多肽质谱库

Nat. Biotechnol. | 用机器学习预测多肽质谱库

专知会员服务

18+阅读 · 2022年9月12日

Nature Medicine | AI与临床相结合，最新DECIDE-AI指南助力临床人工智能从开发到实施

Nature Medicine | AI与临床相结合，最新DECIDE-AI指南助力临床人工智能从开发到实施

专知会员服务

29+阅读 · 2022年5月22日

最新《可解释人工智能XAI：机会与挑战》25页pdf，Opportunities and Challenges in Explainable Artificial Intelligence (XAI): A Survey

最新《可解释人工智能XAI：机会与挑战》25页pdf，Opportunities and Challenges in Explainable Artificial Intelligence (XAI): A Survey

专知会员服务

182+阅读 · 2020年6月23日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知会员服务

166+阅读 · 2019年12月21日

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

专知会员服务

11+阅读 · 2019年12月16日

【北京智源大会2019】人与人工智能共生的伦理与责任（ Ethical and Responsible AI for Human-AI Symbiosis ）中国科学院自动化研究所| 曾毅

【北京智源大会2019】人与人工智能共生的伦理与责任（ Ethical and Responsible AI for Human-AI Symbiosis ）中国科学院自动化研究所| 曾毅

专知会员服务

13+阅读 · 2019年11月22日

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

专知会员服务

32+阅读 · 2019年10月25日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知

10+阅读 · 2019年12月21日

人工智能应用实践与趋势

人工智能应用实践与趋势

人工智能学家

13+阅读 · 2019年9月20日

人工智能的现状与未来（附PPT）

人工智能的现状与未来（附PPT）

人工智能学家

76+阅读 · 2019年3月27日

AI+医疗真正落地？Nature Medicine同时刊登9篇论文，聚焦人工智能在医学领域的应用

AI+医疗真正落地？Nature Medicine同时刊登9篇论文，聚焦人工智能在医学领域的应用

专知

14+阅读 · 2019年1月12日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【论文推荐】最新六篇知识图谱相关论文—事件演化图、神经词义消歧、增强神经网络、Mem2Seq、用户偏好传播、概率嵌入

【论文推荐】最新六篇知识图谱相关论文—事件演化图、神经词义消歧、增强神经网络、Mem2Seq、用户偏好传播、概率嵌入

专知

19+阅读 · 2018年6月14日

AI综述专栏|跨领域推荐系统文献综述（下）

AI综述专栏|跨领域推荐系统文献综述（下）

人工智能前沿讲习班

14+阅读 · 2018年5月18日

AI综述专栏 | 跨领域推荐系统文献综述（上）

AI综述专栏 | 跨领域推荐系统文献综述（上）

人工智能前沿讲习班

13+阅读 · 2018年5月16日

【知识图谱】肖仰华：基于知识图谱的可解释人工智能：机遇与挑战

【知识图谱】肖仰华：基于知识图谱的可解释人工智能：机遇与挑战

产业智能官

14+阅读 · 2017年11月2日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

多视角识别长非编码RNA和人类复杂疾病关联预测研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于被引科学知识突变的突破性创新动态识别及其形成机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构网络的致病基因及其复合物预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

CPU和GPU混合体系结构上生物网络比对并行算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

产学研合作创新网络演化机理、模型及政策研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向生物威胁快速反应的大数据分析关键技术

国家自然科学基金

0+阅读 · 2014年12月31日

城市知识流的表征及其结构演化的复杂性研究

国家自然科学基金

0+阅读 · 2014年12月31日

生物神经系统的若干问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

AI Economist Agent: An Agentic Framework for Model-Grounded Economic Analysis with RAG, Knowledge Graphs, and Large Language Models

Arxiv

0+阅读 · 6月18日

Toward Human-Centered AI-Assisted Terminology Work

Arxiv

0+阅读 · 6月17日

EpiBench: Verifiable Evaluation of AI Agents on Epigenomics Analysis

Arxiv

0+阅读 · 6月11日

The Internet of Agentic AI: Communication, Coordination, and Collective Intelligence at Scale

Arxiv

0+阅读 · 6月11日

Can AI Agents Synthesize Scientific Conclusions?

Arxiv

0+阅读 · 6月9日

The Human-AI Delegation-Verification Dilemma: Individual Strategies, Collective Equilibria and Sociotechnical Lock-in

Arxiv

0+阅读 · 6月5日

Insurance of Agentic AI

Arxiv

0+阅读 · 6月3日

The Human-AI Delegation Dilemma: Individual Strategies, Collective Equilibria and Sociotechnical Lock-in

Arxiv

0+阅读 · 5月20日

Traditional statistical representations outperform generative AI in identifying expert peer reviewers

Arxiv

0+阅读 · 5月18日

Neural Approaches to Conversational AI

Arxiv

26+阅读 · 2018年9月21日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

4+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

5+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

8+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

12+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

5+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

7+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

8+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

6+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

7+阅读 · 6月16日

相关VIP内容

从Idea构想到论文发表：AI for Research全链路综述与实践

从Idea构想到论文发表：AI for Research全链路综述与实践

专知会员服务

24+阅读 · 2025年7月21日

《人工智能武器化：恐怖主义与战争的新阶段》2025最新134页

《人工智能武器化：恐怖主义与战争的新阶段》2025最新134页

专知会员服务

26+阅读 · 2025年5月3日

Nature Methods主题特刊：关注 AI 在生物学中的应用

Nature Methods主题特刊：关注 AI 在生物学中的应用

专知会员服务

18+阅读 · 2024年8月17日

Nat. Biotechnol. | 用机器学习预测多肽质谱库

Nat. Biotechnol. | 用机器学习预测多肽质谱库

专知会员服务

18+阅读 · 2022年9月12日

Nature Medicine | AI与临床相结合，最新DECIDE-AI指南助力临床人工智能从开发到实施

Nature Medicine | AI与临床相结合，最新DECIDE-AI指南助力临床人工智能从开发到实施

专知会员服务

29+阅读 · 2022年5月22日

最新《可解释人工智能XAI：机会与挑战》25页pdf，Opportunities and Challenges in Explainable Artificial Intelligence (XAI): A Survey

最新《可解释人工智能XAI：机会与挑战》25页pdf，Opportunities and Challenges in Explainable Artificial Intelligence (XAI): A Survey

专知会员服务

182+阅读 · 2020年6月23日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知会员服务

166+阅读 · 2019年12月21日

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

专知会员服务

11+阅读 · 2019年12月16日

【北京智源大会2019】人与人工智能共生的伦理与责任（ Ethical and Responsible AI for Human-AI Symbiosis ）中国科学院自动化研究所| 曾毅

【北京智源大会2019】人与人工智能共生的伦理与责任（ Ethical and Responsible AI for Human-AI Symbiosis ）中国科学院自动化研究所| 曾毅

专知会员服务

13+阅读 · 2019年11月22日

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

专知会员服务

32+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知

10+阅读 · 2019年12月21日

人工智能应用实践与趋势

人工智能应用实践与趋势

人工智能学家

13+阅读 · 2019年9月20日

人工智能的现状与未来（附PPT）

人工智能的现状与未来（附PPT）

人工智能学家

76+阅读 · 2019年3月27日

AI+医疗真正落地？Nature Medicine同时刊登9篇论文，聚焦人工智能在医学领域的应用

AI+医疗真正落地？Nature Medicine同时刊登9篇论文，聚焦人工智能在医学领域的应用

专知

14+阅读 · 2019年1月12日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【论文推荐】最新六篇知识图谱相关论文—事件演化图、神经词义消歧、增强神经网络、Mem2Seq、用户偏好传播、概率嵌入

【论文推荐】最新六篇知识图谱相关论文—事件演化图、神经词义消歧、增强神经网络、Mem2Seq、用户偏好传播、概率嵌入

专知

19+阅读 · 2018年6月14日

AI综述专栏|跨领域推荐系统文献综述（下）

AI综述专栏|跨领域推荐系统文献综述（下）

人工智能前沿讲习班

14+阅读 · 2018年5月18日

AI综述专栏 | 跨领域推荐系统文献综述（上）

AI综述专栏 | 跨领域推荐系统文献综述（上）

人工智能前沿讲习班

13+阅读 · 2018年5月16日

【知识图谱】肖仰华：基于知识图谱的可解释人工智能：机遇与挑战

【知识图谱】肖仰华：基于知识图谱的可解释人工智能：机遇与挑战

产业智能官

14+阅读 · 2017年11月2日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

AI Economist Agent: An Agentic Framework for Model-Grounded Economic Analysis with RAG, Knowledge Graphs, and Large Language Models

Arxiv

0+阅读 · 6月18日

Toward Human-Centered AI-Assisted Terminology Work

Arxiv

0+阅读 · 6月17日

EpiBench: Verifiable Evaluation of AI Agents on Epigenomics Analysis

Arxiv

0+阅读 · 6月11日

The Internet of Agentic AI: Communication, Coordination, and Collective Intelligence at Scale

Arxiv

0+阅读 · 6月11日

Can AI Agents Synthesize Scientific Conclusions?

Arxiv

0+阅读 · 6月9日

The Human-AI Delegation-Verification Dilemma: Individual Strategies, Collective Equilibria and Sociotechnical Lock-in

Arxiv

0+阅读 · 6月5日

Insurance of Agentic AI

Arxiv

0+阅读 · 6月3日

The Human-AI Delegation Dilemma: Individual Strategies, Collective Equilibria and Sociotechnical Lock-in

Arxiv

0+阅读 · 5月20日

Traditional statistical representations outperform generative AI in identifying expert peer reviewers

Arxiv

0+阅读 · 5月18日

Neural Approaches to Conversational AI

Arxiv

26+阅读 · 2018年9月21日

相关基金

多视角识别长非编码RNA和人类复杂疾病关联预测研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于被引科学知识突变的突破性创新动态识别及其形成机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构网络的致病基因及其复合物预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

CPU和GPU混合体系结构上生物网络比对并行算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

产学研合作创新网络演化机理、模型及政策研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向生物威胁快速反应的大数据分析关键技术

国家自然科学基金

0+阅读 · 2014年12月31日

城市知识流的表征及其结构演化的复杂性研究

国家自然科学基金

0+阅读 · 2014年12月31日

生物神经系统的若干问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员