Deep reinforcement learning (DRL) is increasingly applied to de novo molecular design, but choices in data, rewards, and evaluation can yield uneven performance across disease areas and chemotypes. Despite this, there is no concise synthesis of how fairness is defined, measured, and tested in DRL-based drug discovery. In this rapid evidence review, we synthesize fairness definitions and metrics for DRL-driven molecule generation in healthcare. We focus on three questions: (i) how dataset composition and split strategies, especially scaffold versus random splits, affect evaluation and distribution shift; (ii) how reward design (e.g., QED, docking, toxicity, synthetic accessibility) can create or mitigate bias, with emphasis on cancer targets; and (iii) which measurable metrics best capture fairness. This includes parity across cancer versus non-cancer indications and across cancer subtypes. It also includes distributional balance in key physicochemical descriptors, scaffold/chemotype diversity, groupwise validity, toxicity, and synthetic accessibility. From 2017 onward, we searched major biomedical, computer science, and engineering literature databases and used arXiv for horizon scanning. Records were screened using PRISMA-style procedures and analyzed via content coding to link reported parity outcomes to dataset and reward choices. Our review provides a concise set of fairness definitions and metrics for DRL molecule generation. It offers practical guidance for reporting distribution parity and outcome parity. It also summarizes how dataset and reward choices relate to observed parity effects and identifies open gaps relevant to trustworthy, cancer-relevant DRL generation.


翻译:深度强化学习正日益应用于从头分子设计,但数据、奖励函数和评估方式的选择可能导致在不同疾病领域和化学类型间产生不均匀的性能表现。尽管存在这一问题,目前尚缺乏关于如何在基于深度强化学习的药物发现中定义、度量和检验公平性的系统性综合研究。本快速证据综述综合了面向医疗领域深度强化学习驱动分子生成的公平性定义与度量标准。我们聚焦三个问题:(i)数据集构成和划分策略(特别是支架划分与随机划分)如何影响评估和分布偏移;(ii)奖励函数设计(如QED、对接评分、毒性、合成可及性)如何产生或缓解偏差,重点关注癌症靶点;(iii)哪些可量化指标最能反映公平性,包括癌症与非癌症适应症之间及癌症亚型间的均等性,同时涵盖关键理化描述符的分布均衡性、支架/化学类型多样性、分组有效性、毒性及合成可及性。我们系统检索了2017年以来生物医学、计算机科学和工程领域的主要文献数据库,并利用arXiv进行前沿动态扫描。采用PRISMA流程筛选文献,并通过内容编码方法将报告出的均等性结果与数据集和奖励函数选择进行关联分析。本综述为深度强化学习分子生成提供了简明的公平性定义与度量体系,给出了报告分布均等性和结果均等性的实用指南,总结了数据集与奖励函数选择如何影响观测到的均等性效应,并识别了与可信赖的癌症相关深度强化学习生成领域相关的待解决空白。

0
下载
关闭预览

相关内容

面向强化学习的可解释性研究综述
专知会员服务
44+阅读 · 2024年7月30日
药物发现中的深度学习
专知会员服务
42+阅读 · 2022年11月14日
【牛津大学博士论文】深度学习临床前药物发现
专知会员服务
51+阅读 · 2022年9月30日
结合进化算法的深度强化学习方法研究综述
专知会员服务
81+阅读 · 2022年7月16日
【MIT博士论文】分子图表示学习与生成的药物发现
专知会员服务
49+阅读 · 2022年6月28日
深度学习药物发现综述
专知会员服务
59+阅读 · 2022年6月2日
人工智能到深度学习:药物发现的机器智能方法
专知会员服务
37+阅读 · 2022年5月6日
Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证
深度强化学习实验室
20+阅读 · 2020年8月11日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
Arxiv
29+阅读 · 2023年2月10日
Arxiv
18+阅读 · 2021年3月16日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
2+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
3+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
3+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
面向强化学习的可解释性研究综述
专知会员服务
44+阅读 · 2024年7月30日
药物发现中的深度学习
专知会员服务
42+阅读 · 2022年11月14日
【牛津大学博士论文】深度学习临床前药物发现
专知会员服务
51+阅读 · 2022年9月30日
结合进化算法的深度强化学习方法研究综述
专知会员服务
81+阅读 · 2022年7月16日
【MIT博士论文】分子图表示学习与生成的药物发现
专知会员服务
49+阅读 · 2022年6月28日
深度学习药物发现综述
专知会员服务
59+阅读 · 2022年6月2日
人工智能到深度学习:药物发现的机器智能方法
专知会员服务
37+阅读 · 2022年5月6日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员