Genetic evidence is enriched among approved drug targets: in an observational analysis of 26,278 target-disease pairs from Open Targets and ChEMBL, targets with any genetic association had a 3.25-fold higher approval rate than those without (OR = 3.25, 95% CI 2.79-3.79, p = 1.91e-42). A target-level analysis accounting for non-independence of pairs sharing the same gene gave OR = 2.79 (bootstrap 95% CI 2.22-3.53); the oncology pair-level OR of 6.72 attenuates to 2.71 at the target level, illustrating how non-independence inflates area-specific estimates. The enrichment replicated in post-2015 approvals (OR = 3.51, p = 1.72e-8). Feature ablation across six evidence types revealed that literature mining alone accounts for most classifier performance (AUPRC = 0.099 versus 0.109 for all features), consistent with temporal leakage from post-approval publications. Excluding literature, remaining evidence types retain above-baseline signal (AUPRC = 0.084, 1.63x baseline). Sensitivity analyses bracket the pair-level OR between 3.25 and 4.93. Genetic evidence alone yields only a 1.0-percentage-point absolute AUPRC gain and the best model has poor calibration; the classifier has limited practical predictive value. We catalogue 1,433 genetically supported Phase 1/2 pairs as a hypothesis-generating resource. All findings are observational.


翻译:遗传学证据在已获批药物靶点中富集:一项基于Open Targets与ChEMBL数据库26,278个靶点-疾病对的观察性分析显示,具有任何遗传关联的靶点其获批率是无关联靶点的3.25倍(OR=3.25, 95% CI 2.79-3.79, p=1.91e-42)。针对共享同一基因的靶点-疾病对非独立性问题进行的靶点层面分析显示OR=2.79(自助法95% CI 2.22-3.53);肿瘤学领域成对分析中OR=6.72在靶点层面降至2.71,揭示了非独立性如何导致区域特异性估计值膨胀。该富集现象在2015年后获批药物中复现(OR=3.51, p=1.72e-8)。六类证据类型的特征消融分析表明,仅文献挖掘单一特征即可贡献绝大多数分类器性能(全部特征AUPRC=0.109,文献挖掘特征AUPRC=0.099),这与获批后文献造成的时间泄露效应一致。排除文献特征后,其余证据类型仍保留高于基线的信号(AUPRC=0.084,为基线水平的1.63倍)。敏感性分析将成对分析OR值限定在3.25-4.93范围内。单纯遗传学证据仅带来1.0个百分点的AUPRC绝对增益,且最优模型校准度较差;该分类器实际预测价值有限。本研究汇编了1,433个具有遗传学支持的I/II期靶点-疾病对,作为假说生成资源。所有发现均为观察性结果。

0
下载
关闭预览

相关内容

Transformer在药物发现及其他领域的应用综述
专知会员服务
17+阅读 · 2024年9月3日
用于药物发现的抗体表征学习
专知会员服务
10+阅读 · 2022年10月31日
【干货书】数据挖掘药物发现,347页pdf
专知会员服务
136+阅读 · 2021年9月20日
从传统方法到深度学习,人脸关键点检测方法综述
机器之心
14+阅读 · 2017年12月17日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关资讯
从传统方法到深度学习,人脸关键点检测方法综述
机器之心
14+阅读 · 2017年12月17日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员