The convergence of artificial intelligence and materials science presents a transformative opportunity, but achieving true acceleration in discovery requires moving beyond task-isolated, fine-tuned models toward agentic systems that plan, act, and learn across the full discovery loop. This survey advances a unique pipeline-centric view that spans from corpus curation and pretraining, through domain adaptation and instruction tuning, to goal-conditioned agents interfacing with simulation and experimental platforms. Unlike prior reviews, we treat the entire process as an end-to-end system to be optimized for tangible discovery outcomes rather than proxy benchmarks. This perspective allows us to trace how upstream design choices-such as data curation and training objectives-can be aligned with downstream experimental success through effective credit assignment. To bridge communities and establish a shared frame of reference, we first present an integrated lens that aligns terminology, evaluation, and workflow stages across AI and materials science. We then analyze the field through two focused lenses: From the AI perspective, the survey details LLM strengths in pattern recognition, predictive analytics, and natural language processing for literature mining, materials characterization, and property prediction; from the materials science perspective, it highlights applications in materials design, process optimization, and the acceleration of computational workflows via integration with external tools (e.g., DFT, robotic labs). Finally, we contrast passive, reactive approaches with agentic design, cataloging current contributions while motivating systems that pursue long-horizon goals with autonomy, memory, and tool use. This survey charts a practical roadmap towards autonomous, safety-aware LLM agents aimed at discovering novel and useful materials.


翻译:人工智能与材料科学的融合带来了变革性机遇,但要在发现过程中实现真正的加速,需要超越任务孤立、微调的模型,转向能够在完整发现循环中进行规划、行动和学习的智能体系统。本综述提出了一种独特的以流程为中心的观点,涵盖从语料库构建与预训练、领域适应与指令微调,到与模拟及实验平台交互的目标条件智能体。与以往综述不同,我们将整个过程视为一个端到端系统,旨在优化实际发现成果而非代理基准。这一视角使我们能够追溯上游设计选择(如数据构建和训练目标)如何通过有效的信用分配与下游实验成功对齐。为连接不同领域并建立共同的参考框架,我们首先提出一个整合视角,以对齐人工智能与材料科学在术语、评估和工作流程阶段的理解。随后,我们通过两个聚焦视角分析该领域:从人工智能视角,本综述详述了大型语言模型在模式识别、预测分析和自然语言处理方面的优势,及其在文献挖掘、材料表征和性能预测中的应用;从材料科学视角,则重点介绍了在材料设计、工艺优化以及通过与外部工具(如密度泛函理论、机器人实验室)集成加速计算工作流程等方面的应用。最后,我们对比了被动反应式方法与智能体设计,梳理了当前贡献,同时激励开发具备自主性、记忆和工具使用能力、追求长远目标的系统。本综述为旨在发现新颖实用材料的自主、安全感知的大型语言模型智能体绘制了一条切实可行的路线图。

0
下载
关闭预览

相关内容

《科研智能发展报告(2025年)》发布
专知会员服务
29+阅读 · 1月14日
智能体工程(Agent Engineering)
专知会员服务
27+阅读 · 2025年12月31日
迈向智能体系统规模化的科学
专知会员服务
20+阅读 · 2025年12月12日
中国AI+材料科学产业应用研究报告,41页pdf
专知会员服务
60+阅读 · 2021年12月6日
专知会员服务
43+阅读 · 2021年9月7日
【人机融合智能】人机融合智能的现状与展望
产业智能官
11+阅读 · 2020年3月18日
【类脑智能】类脑智能技术初探
产业智能官
15+阅读 · 2020年2月16日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
44+阅读 · 2019年10月16日
人工智能的现状与未来(附PPT)
人工智能学家
76+阅读 · 2019年3月27日
人工智能在教育领域的应用探析
MOOC
14+阅读 · 2019年3月16日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
0+阅读 · 2017年6月30日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2月18日
VIP会员
相关VIP内容
《科研智能发展报告(2025年)》发布
专知会员服务
29+阅读 · 1月14日
智能体工程(Agent Engineering)
专知会员服务
27+阅读 · 2025年12月31日
迈向智能体系统规模化的科学
专知会员服务
20+阅读 · 2025年12月12日
中国AI+材料科学产业应用研究报告,41页pdf
专知会员服务
60+阅读 · 2021年12月6日
专知会员服务
43+阅读 · 2021年9月7日
相关基金
国家自然科学基金
0+阅读 · 2017年6月30日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员