Notes2Skills: From Lab Notebooks to Certainty-Aware Scientific Agent Skills - 专知论文

会员服务 ·

0

置信度 · 不确定 · 智能体 · 论文 · 人工智能智能体 ·

Notes2Skills: From Lab Notebooks to Certainty-Aware Scientific Agent Skills

翻译：笔记到技能：从实验记录到置信度感知的科学智能体技能

Shi Liu,Jiayao Chen,Chengwei Qin,Yanqing Hu,Jufan Zhang,Linyi Yang

from arxiv, 28 pages, preprint

Scientific discovery workflows usually contain and rely heavily on lab notes, where researchers record observations, interpret uncertain results, and plan follow-up experiments. Such informative lab notes preserve evolving scientific reasoning and author uncertainty, rather than polished final results exhibited in publications, providing a valuable opportunity for AI to engage in scientific exploration at a more comprehensive and deeper level. However, most prior work on scientific text focuses on papers, protocols, or structured databases, leaving informal laboratory notes underexplored as inputs to AI agents for science. This gap matters because lab notes often intermingle validated observations, tentative judgments, and possible experimental next steps within the same passage. If these signals are conflated, an AI agent may mistake uncertain scientific judgments for confirmed conclusions or executable actions. To this end, we present Notes2Skills, a two-stage framework for turning lab notebooks into verifiable skills for scientific AI agents while preserving the author's certainty. Across seven conditions and three wet-lab sessions, Notes2Skills is the only configuration that neither mistakes uncertain notes for firm instructions nor discards firm ones. We show that certainty preservation is the missing piece between lab notebooks and reliable agent skills, opening a path toward safer AI co-scientist systems.

翻译：科学发现工作流通常包含并高度依赖实验记录，研究人员在其中记录观测结果、解释不确定性发现并规划后续实验。这类蕴含丰富信息的实验记录保留了不断演化的科学推理过程和作者的不确定性，而非论文中展示的经过修饰的最终成果，为人工智能更全面、更深入地参与科学探索提供了宝贵机会。然而，此前大多数关于科学文本的研究集中于论文、实验方案或结构化数据库，非正式的实验记录作为人工智能科学智能体的输入来源尚未得到充分探索。这一空白之所以关键，是因为实验记录常常在同一段落中混合已验证的观测结果、暂定判断和可能的实验后续步骤。若这些信号被混淆，人工智能智能体可能将不确定的科学判断误认为已确认的结论或可执行的操作。为此，我们提出了Notes2Skills，一个两阶段框架，用以在保留作者置信度的同时，将实验记录转化为科学人工智能智能体可验证的技能。在七种条件和三次湿实验室实验中，Notes2Skills是唯一一种既不会将不确定记录误认为明确指令、也不会丢弃明确指令的配置方案。我们证明，置信度的保留是连接实验记录与可靠智能体技能的关键缺失环节，这为构建更安全的人工智能联合科学家系统开辟了道路。

0

相关内容

置信度

PaperOrchestra：一种面向自动化 AI 学术论文撰写的多智能体框架

PaperOrchestra：一种面向自动化 AI 学术论文撰写的多智能体框架

专知会员服务

13+阅读 · 4月9日

具身科学：利用代理型具身人工智能构建闭环科学发现

具身科学：利用代理型具身人工智能构建闭环科学发现

专知会员服务

14+阅读 · 3月24日

人工智能遇见大脑：从认知神经科学到自主智能体的记忆系统统一综述

人工智能遇见大脑：从认知神经科学到自主智能体的记忆系统统一综述

专知会员服务

26+阅读 · 1月4日

《面向科学发现的智能体人工智能：进展、挑战与未来方向综述》

《面向科学发现的智能体人工智能：进展、挑战与未来方向综述》

专知会员服务

60+阅读 · 2025年3月14日

【AAAI2025】迈向科学发现的生成式人工智能：进展、机遇与挑战

【AAAI2025】迈向科学发现的生成式人工智能：进展、机遇与挑战

专知会员服务

59+阅读 · 2024年12月17日

【AI4Science】Nature刊文综述人工智能时代的科学发现

【AI4Science】Nature刊文综述人工智能时代的科学发现

专知会员服务

74+阅读 · 2023年8月8日

重磅！60+位作者发布263页pdf《AI4Science》论文，百科全书式概述人工智能在量子、原子级和连续系统科学的应用

重磅！60+位作者发布263页pdf《AI4Science》论文，百科全书式概述人工智能在量子、原子级和连续系统科学的应用

专知会员服务

155+阅读 · 2023年7月18日

【AI4Science】《人工智能科学：深度学习革命》2023新书，

【AI4Science】《人工智能科学：深度学习革命》2023新书，

专知会员服务

214+阅读 · 2023年6月15日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知会员服务

204+阅读 · 2023年4月5日

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

专知会员服务

29+阅读 · 2022年2月17日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

62+阅读 · 2023年4月5日

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

专知

15+阅读 · 2022年11月8日

【干货书】知识图谱:基础，技术与应用，568页pdf

【干货书】知识图谱:基础，技术与应用，568页pdf

专知

15+阅读 · 2022年8月18日

如何进AI大厂？这本书400页《深度学习面试指南》书202页pdf简介实战中DL问题与解决答案，

如何进AI大厂？这本书400页《深度学习面试指南》书202页pdf简介实战中DL问题与解决答案，

专知

10+阅读 · 2022年1月5日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

专知

10+阅读 · 2019年3月12日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

大牛的《深度学习》笔记，Deep Learning速成教程

大牛的《深度学习》笔记，Deep Learning速成教程

极市平台

18+阅读 · 2018年4月10日

【深度学习】大牛的《深度学习》笔记，Deep Learning速成教程

【深度学习】大牛的《深度学习》笔记，Deep Learning速成教程

产业智能官

12+阅读 · 2018年4月6日

Github 项目推荐 | Scikit-learn（sklearn）官方文档中文版

Github 项目推荐 | Scikit-learn（sklearn）官方文档中文版

AI研习社

10+阅读 · 2018年4月5日

面向大类别的空中手写中英文识别技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

面向人类工作记忆改善的脑电复杂网络信息反馈非线性计算模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

中美科学基金资助与知识生产比较研究

国家自然科学基金

1+阅读 · 2014年12月31日

Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory

Arxiv

0+阅读 · 6月15日

Benchmarking AI Agents for Addressing Scientific Challenges Across Scales

Arxiv

0+阅读 · 6月10日

Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory

Arxiv

0+阅读 · 6月10日

SciVisAgentSkills: Design and Evaluation of Agent Skills for Scientific Data Analysis and Visualization

Arxiv

0+阅读 · 6月4日

A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications

Arxiv

0+阅读 · 5月26日

sciwrite-lint: Verification Infrastructure for the Age of Science Vibe-Writing

Arxiv

0+阅读 · 5月24日

A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications

Arxiv

0+阅读 · 5月19日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月12日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月11日

A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications

Arxiv

0+阅读 · 5月8日

VIP会员

文章信息

相关主题

人工智能智能体

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

1+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

3+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

5+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

6+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

9+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

13+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

9+阅读 · 6月17日

相关VIP内容

PaperOrchestra：一种面向自动化 AI 学术论文撰写的多智能体框架

PaperOrchestra：一种面向自动化 AI 学术论文撰写的多智能体框架

专知会员服务

13+阅读 · 4月9日

具身科学：利用代理型具身人工智能构建闭环科学发现

具身科学：利用代理型具身人工智能构建闭环科学发现

专知会员服务

14+阅读 · 3月24日

人工智能遇见大脑：从认知神经科学到自主智能体的记忆系统统一综述

人工智能遇见大脑：从认知神经科学到自主智能体的记忆系统统一综述

专知会员服务

26+阅读 · 1月4日

《面向科学发现的智能体人工智能：进展、挑战与未来方向综述》

《面向科学发现的智能体人工智能：进展、挑战与未来方向综述》

专知会员服务

60+阅读 · 2025年3月14日

【AAAI2025】迈向科学发现的生成式人工智能：进展、机遇与挑战

【AAAI2025】迈向科学发现的生成式人工智能：进展、机遇与挑战

专知会员服务

59+阅读 · 2024年12月17日

【AI4Science】Nature刊文综述人工智能时代的科学发现

【AI4Science】Nature刊文综述人工智能时代的科学发现

专知会员服务

74+阅读 · 2023年8月8日

重磅！60+位作者发布263页pdf《AI4Science》论文，百科全书式概述人工智能在量子、原子级和连续系统科学的应用

重磅！60+位作者发布263页pdf《AI4Science》论文，百科全书式概述人工智能在量子、原子级和连续系统科学的应用

专知会员服务

155+阅读 · 2023年7月18日

【AI4Science】《人工智能科学：深度学习革命》2023新书，

【AI4Science】《人工智能科学：深度学习革命》2023新书，

专知会员服务

214+阅读 · 2023年6月15日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知会员服务

204+阅读 · 2023年4月5日

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

专知会员服务

29+阅读 · 2022年2月17日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

62+阅读 · 2023年4月5日

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

专知

15+阅读 · 2022年11月8日

【干货书】知识图谱:基础，技术与应用，568页pdf

【干货书】知识图谱:基础，技术与应用，568页pdf

专知

15+阅读 · 2022年8月18日

如何进AI大厂？这本书400页《深度学习面试指南》书202页pdf简介实战中DL问题与解决答案，

如何进AI大厂？这本书400页《深度学习面试指南》书202页pdf简介实战中DL问题与解决答案，

专知

10+阅读 · 2022年1月5日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

MIT课程：深度学习背后的科学—架起理论与实践的桥梁

专知

10+阅读 · 2019年3月12日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

大牛的《深度学习》笔记，Deep Learning速成教程

大牛的《深度学习》笔记，Deep Learning速成教程

极市平台

18+阅读 · 2018年4月10日

【深度学习】大牛的《深度学习》笔记，Deep Learning速成教程

【深度学习】大牛的《深度学习》笔记，Deep Learning速成教程

产业智能官

12+阅读 · 2018年4月6日

Github 项目推荐 | Scikit-learn（sklearn）官方文档中文版

Github 项目推荐 | Scikit-learn（sklearn）官方文档中文版

AI研习社

10+阅读 · 2018年4月5日

相关论文

Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory

Arxiv

0+阅读 · 6月15日

Benchmarking AI Agents for Addressing Scientific Challenges Across Scales

Arxiv

0+阅读 · 6月10日

Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory

Arxiv

0+阅读 · 6月10日

SciVisAgentSkills: Design and Evaluation of Agent Skills for Scientific Data Analysis and Visualization

Arxiv

0+阅读 · 6月4日

A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications

Arxiv

0+阅读 · 5月26日

sciwrite-lint: Verification Infrastructure for the Age of Science Vibe-Writing

Arxiv

0+阅读 · 5月24日

A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications

Arxiv

0+阅读 · 5月19日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月12日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月11日

A Comprehensive Survey on Agent Skills: Taxonomy, Techniques, and Applications

Arxiv

0+阅读 · 5月8日

相关基金

面向大类别的空中手写中英文识别技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

面向人类工作记忆改善的脑电复杂网络信息反馈非线性计算模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

中美科学基金资助与知识生产比较研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员