Predictive Inorganic Synthesis based on Machine Learning using Small Data sets: a case study of size-controlled Cu Nanoparticles - 专知论文

会员服务 ·

0

合成 · 数据集 · 可控 · 纳米颗粒 · 机器学习 ·

Predictive Inorganic Synthesis based on Machine Learning using Small Data sets: a case study of size-controlled Cu Nanoparticles

翻译：基于小数据集的机器学习预测无机合成：以尺寸可控铜纳米颗粒为例

Brent Motmans,Digvijay Ghogare,Thijs G. I. van Wijk,Joren Van Herck,Pieter De Meyer,Berend Smit,An Hardy,Danny E. P. Vanpoucke

from arxiv, 23 pages, 17 figures, 13 tables (including SI)

Copper nanoparticles (Cu NPs) have a broad applicability, yet their synthesis is sensitive to subtle changes in reaction parameters. This sensitivity, combined with the time- and resource-intensive nature of experimental optimization, poses a major challenge in achieving reproducible and size-controlled synthesis. While Machine Learning (ML) shows promise in materials research, its application is often limited by scarcity of large high-quality experimental data sets. This study explores ML to predict the size of Cu NPs from microwave-assisted polyol synthesis using a small data set of 25 in-house performed syntheses. Latin Hypercube Sampling is used to efficiently cover the parameter space while creating the experimental data set. Ensemble regression models successfully predict particle sizes with high accuracy ($R^2 = 0.74$), outperforming classical statistical approaches ($R^2 = 0.60$). Additionally, classification models using both random forests and Large Language Models (LLMs) are evaluated to distinguish between large and small particles. While random forests show moderate performance, LLMs offer no significant advantages under data-scarce conditions. Overall, this study demonstrates that carefully curated small data sets, paired with robust classical ML, can effectively predict the synthesis of Cu NPs and highlights that for lab-scale studies, complex models like LLMs may offer limited benefit over simpler techniques.

翻译：铜纳米颗粒（Cu NPs）具有广泛的应用前景，但其合成过程对反应参数的细微变化极为敏感。这种敏感性，加上实验优化过程耗时且资源密集的特性，使得实现可重复且尺寸可控的合成面临重大挑战。尽管机器学习在材料研究中展现出潜力，但其应用常受限于高质量大规模实验数据集的稀缺。本研究探索了利用机器学习，基于一个仅包含25次内部合成实验的小型数据集，来预测微波辅助多元醇法合成中Cu NPs的尺寸。在创建实验数据集时，采用拉丁超立方采样法以高效覆盖参数空间。集成回归模型成功高精度地预测了颗粒尺寸（$R^2 = 0.74$），其表现优于经典统计方法（$R^2 = 0.60$）。此外，本研究评估了使用随机森林和大语言模型（LLMs）的分类模型，以区分大颗粒与小颗粒。随机森林表现出中等性能，而LLMs在数据稀缺条件下未显示出显著优势。总体而言，本研究证明，精心构建的小型数据集与稳健的经典机器学习方法相结合，可以有效预测Cu NPs的合成结果，并强调对于实验室规模的研究，LLMs等复杂模型相较于更简单的技术可能益处有限。

0

相关内容

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

专知会员服务

25+阅读 · 1月16日

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

专知会员服务

24+阅读 · 2025年8月14日

【MIT博士论文】从数据到模型，再回到数据：构建可预测且可靠的机器学习系统”

【MIT博士论文】从数据到模型，再回到数据：构建可预测且可靠的机器学习系统”

专知会员服务

22+阅读 · 2025年6月19日

【CMU博士论文】基于机器学习的可信科学推理

【CMU博士论文】基于机器学习的可信科学推理

专知会员服务

16+阅读 · 2025年5月26日

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

专知会员服务

34+阅读 · 2022年8月6日

【AI+新材料】MIT学者利用计算建模指导新材料的开发，Using Machine Learning and Data Mining to Leverage Community Knowledge for the Engineering of Stable Metal–Organic Frameworks

【AI+新材料】MIT学者利用计算建模指导新材料的开发，Using Machine Learning and Data Mining to Leverage Community Knowledge for the Engineering of Stable Metal–Organic Frameworks

专知会员服务

24+阅读 · 2022年3月13日

机器学习技术在材料科学领域中的应用进展

专知会员服务

43+阅读 · 2021年9月7日

融合零样本学习和小样本学习的弱监督机器学习方法综述

专知会员服务

113+阅读 · 2020年3月20日

【Nature交叉学科论文】机器学习在固体材料科学中的最新进展和应用，Recent advances and applications of machine learning in solidstate materials science

【Nature交叉学科论文】机器学习在固体材料科学中的最新进展和应用，Recent advances and applications of machine learning in solidstate materials science

专知会员服务

36+阅读 · 2019年12月21日

CMU博士论文：可微优化机器学习建模

CMU博士论文：可微优化机器学习建模

专知会员服务

64+阅读 · 2019年10月26日

【干货书】深度学习合成数据，354页pdf，Synthetic Data for Deep Learning

【干货书】深度学习合成数据，354页pdf，Synthetic Data for Deep Learning

专知

10+阅读 · 2022年2月10日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

【仿真】基于大数据的机器学习与数值仿真技术

【仿真】基于大数据的机器学习与数值仿真技术

产业智能官

51+阅读 · 2019年9月3日

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

专知

127+阅读 · 2019年3月31日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

机器学习模型的“可解释性”到底有多重要？

机器学习模型的“可解释性”到底有多重要？

中国科学院自动化研究所

20+阅读 · 2018年3月1日

基于信息理论的机器学习

基于信息理论的机器学习

专知

22+阅读 · 2017年11月23日

离子注入合成In纳米颗粒在Al薄膜中超导性质的研究

国家自然科学基金

0+阅读 · 2015年12月31日

氧化亚铜表面金属纳米晶的选择性生长及其对催化性能的影响

国家自然科学基金

0+阅读 · 2015年12月31日

金纳米颗粒的限域生长及FeOx-Au@SiO2纳米结构的催化活性

国家自然科学基金

0+阅读 · 2015年12月31日

铜纳米材料的控制合成与催化性质研究及在催化Ullmann 类型偶联反应的应用

国家自然科学基金

0+阅读 · 2015年12月31日

纳米制造战略研究和学术交流

国家自然科学基金

1+阅读 · 2015年12月31日

多种尺寸的钴纳米团簇的可控合成、结构与性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

纳米多孔铜氧化物多尺度构建与力学性能耦合机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

微纳米压电材料尺寸效应的物理机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

瞬时纳米沉淀法可控制备纳米银及其颗粒生长规律的SAXS研究

国家自然科学基金

0+阅读 · 2014年12月31日

纳米金属微观结构不稳定性机理的三维研究

国家自然科学基金

0+阅读 · 2014年12月31日

Algorithmic Data Minimization for Machine Learning over Internet-of-Things Data Streams

Arxiv

0+阅读 · 3月15日

Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials

Arxiv

0+阅读 · 3月12日

Machine Learning on Heterogeneous, Edge, and Quantum Hardware for Particle Physics (ML-HEQUPP)

Arxiv

0+阅读 · 3月10日

Machine Learning on Heterogeneous, Edge, and Quantum Hardware for Particle Physics (ML-HEQUPP)

Arxiv

0+阅读 · 2月24日

A feature-stable and explainable machine learning framework for trustworthy decision-making under incomplete clinical data

A feature-stable and explainable machine learning framework for trustworthy decision-making under incomplete clinical data

Arxiv

0+阅读 · 2月19日

Learning Data-Efficient and Generalizable Neural Operators via Fundamental Physics Knowledge

Arxiv

0+阅读 · 2月16日

GAMformer: Bridging Tabular Foundation Models and Interpretable Machine Learning

Arxiv

0+阅读 · 2月5日

Digital Twins & ZeroConf AI: Structuring Automated Intelligent Pipelines for Industrial Applications

Arxiv

0+阅读 · 2月4日

Physics Informed Generative AI Enabling Labour Free Segmentation For Microscopy Analysis

Arxiv

0+阅读 · 2月2日

Generative quantum machine learning via denoising diffusion probabilistic models

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

5+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

6+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

4+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

3+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

10+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

7+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

5+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

3+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

7+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

3+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

3+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

7+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

6+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

11+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

5+阅读 · 4月20日

相关VIP内容

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

专知会员服务

25+阅读 · 1月16日

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

专知会员服务

24+阅读 · 2025年8月14日

【MIT博士论文】从数据到模型，再回到数据：构建可预测且可靠的机器学习系统”

【MIT博士论文】从数据到模型，再回到数据：构建可预测且可靠的机器学习系统”

专知会员服务

22+阅读 · 2025年6月19日

【CMU博士论文】基于机器学习的可信科学推理

【CMU博士论文】基于机器学习的可信科学推理

专知会员服务

16+阅读 · 2025年5月26日

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

专知会员服务

34+阅读 · 2022年8月6日

【AI+新材料】MIT学者利用计算建模指导新材料的开发，Using Machine Learning and Data Mining to Leverage Community Knowledge for the Engineering of Stable Metal–Organic Frameworks

【AI+新材料】MIT学者利用计算建模指导新材料的开发，Using Machine Learning and Data Mining to Leverage Community Knowledge for the Engineering of Stable Metal–Organic Frameworks

专知会员服务

24+阅读 · 2022年3月13日

机器学习技术在材料科学领域中的应用进展

专知会员服务

43+阅读 · 2021年9月7日

融合零样本学习和小样本学习的弱监督机器学习方法综述

专知会员服务

113+阅读 · 2020年3月20日

【Nature交叉学科论文】机器学习在固体材料科学中的最新进展和应用，Recent advances and applications of machine learning in solidstate materials science

【Nature交叉学科论文】机器学习在固体材料科学中的最新进展和应用，Recent advances and applications of machine learning in solidstate materials science

专知会员服务

36+阅读 · 2019年12月21日

CMU博士论文：可微优化机器学习建模

CMU博士论文：可微优化机器学习建模

专知会员服务

64+阅读 · 2019年10月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

【干货书】深度学习合成数据，354页pdf，Synthetic Data for Deep Learning

【干货书】深度学习合成数据，354页pdf，Synthetic Data for Deep Learning

专知

10+阅读 · 2022年2月10日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

【仿真】基于大数据的机器学习与数值仿真技术

【仿真】基于大数据的机器学习与数值仿真技术

产业智能官

51+阅读 · 2019年9月3日

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

专知

127+阅读 · 2019年3月31日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

机器学习模型的“可解释性”到底有多重要？

机器学习模型的“可解释性”到底有多重要？

中国科学院自动化研究所

20+阅读 · 2018年3月1日

基于信息理论的机器学习

基于信息理论的机器学习

专知

22+阅读 · 2017年11月23日

相关论文

Algorithmic Data Minimization for Machine Learning over Internet-of-Things Data Streams

Arxiv

0+阅读 · 3月15日

Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials

Arxiv

0+阅读 · 3月12日

Machine Learning on Heterogeneous, Edge, and Quantum Hardware for Particle Physics (ML-HEQUPP)

Arxiv

0+阅读 · 3月10日

Machine Learning on Heterogeneous, Edge, and Quantum Hardware for Particle Physics (ML-HEQUPP)

Arxiv

0+阅读 · 2月24日

A feature-stable and explainable machine learning framework for trustworthy decision-making under incomplete clinical data

A feature-stable and explainable machine learning framework for trustworthy decision-making under incomplete clinical data

Arxiv

0+阅读 · 2月19日

Learning Data-Efficient and Generalizable Neural Operators via Fundamental Physics Knowledge

Arxiv

0+阅读 · 2月16日

GAMformer: Bridging Tabular Foundation Models and Interpretable Machine Learning

Arxiv

0+阅读 · 2月5日

Digital Twins & ZeroConf AI: Structuring Automated Intelligent Pipelines for Industrial Applications

Arxiv

0+阅读 · 2月4日

Physics Informed Generative AI Enabling Labour Free Segmentation For Microscopy Analysis

Arxiv

0+阅读 · 2月2日

Generative quantum machine learning via denoising diffusion probabilistic models

Arxiv

0+阅读 · 1月30日

相关基金

离子注入合成In纳米颗粒在Al薄膜中超导性质的研究

国家自然科学基金

0+阅读 · 2015年12月31日

氧化亚铜表面金属纳米晶的选择性生长及其对催化性能的影响

国家自然科学基金

0+阅读 · 2015年12月31日

金纳米颗粒的限域生长及FeOx-Au@SiO2纳米结构的催化活性

国家自然科学基金

0+阅读 · 2015年12月31日

铜纳米材料的控制合成与催化性质研究及在催化Ullmann 类型偶联反应的应用

国家自然科学基金

0+阅读 · 2015年12月31日

纳米制造战略研究和学术交流

国家自然科学基金

1+阅读 · 2015年12月31日

多种尺寸的钴纳米团簇的可控合成、结构与性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

纳米多孔铜氧化物多尺度构建与力学性能耦合机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

微纳米压电材料尺寸效应的物理机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

瞬时纳米沉淀法可控制备纳米银及其颗粒生长规律的SAXS研究

国家自然科学基金

0+阅读 · 2014年12月31日

纳米金属微观结构不稳定性机理的三维研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员