Machine learning catalyzes a revolution in chemical and biological science. However, its efficacy heavily depends on the availability of labeled data, and annotating biochemical data is extremely laborious. To surmount this data sparsity challenge, we present an instructive learning algorithm named InstructMol to measure pseudo-labels' reliability and help the target model leverage large-scale unlabeled data. InstructMol does not require transferring knowledge between multiple domains, which avoids the potential gap between the pretraining and fine-tuning stages. We demonstrated the high accuracy of InstructMol on several real-world molecular datasets and out-of-distribution (OOD) benchmarks. Code is available at~ https://github.com/smiles724/InstructMol.


翻译:机器学习正在催化化学与生物科学领域的革命。然而,其效能高度依赖于标记数据的可用性,而生物化学数据的标注极其耗时费力。为克服这一数据稀疏性挑战,我们提出了一种名为InstructMol的指导性学习算法,用于评估伪标签的可靠性,并帮助目标模型利用大规模未标记数据。InstructMol无需在多个领域间迁移知识,从而避免了预训练与微调阶段间的潜在差距。我们在多个真实世界分子数据集及分布外(OOD)基准测试中验证了InstructMol的高准确性。代码发布于~ https://github.com/smiles724/InstructMol。

0
下载
关闭预览

相关内容

物理引导的机器学习
专知会员服务
23+阅读 · 2025年5月11日
物理知识辅助的机器学习预测:综述
专知会员服务
30+阅读 · 2024年8月25日
机器学习的可解释性
专知会员服务
69+阅读 · 2020年12月18日
机器学习的可解释性:因果推理和稳定学习
DataFunTalk
13+阅读 · 2020年3月3日
概述自动机器学习(AutoML)
人工智能学家
19+阅读 · 2019年8月11日
可解释的机器学习
平均机器
25+阅读 · 2019年2月25日
基于信息理论的机器学习
专知
22+阅读 · 2017年11月23日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
0+阅读 · 10分钟前
综述 | 世界动作模型:少做梦,多行动
专知会员服务
0+阅读 · 12分钟前
美以伊冲突:无人机与人工智能的运用
专知会员服务
1+阅读 · 24分钟前
《特种部队在透明战场中的生存力》最新报告
专知会员服务
1+阅读 · 44分钟前
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员