Data quality (DQ) and transparency of secondary data are critical factors that delay the adoption of clinical AI models and affect clinician trust in them. Many DQ studies fail to clarify where, along the lifecycle, quality checks occur, leading to uncertainty about provenance and fitness for reuse. This study develops a framework for transparent reporting of DQ assessments across the clinical electronic health record (EHR) data lifecycle. The reporting framework was developed through iterative analysis to identify actors and phases of the clinical data lifecycle. The framework distinguishes between data-generating organizations and data-receiving organizations to allow users to map DQ parameters to stages across the data lifecycle. The framework defines 5 key lifecycle phases and multiple actors. When applied to the real-world dataset, the framework demonstrated applicability in revealing where DQ issues may originate. The framework provides a structured approach for reporting DQ assessments, which can enhance transparency regarding data fitness for reuse, supporting reliable clinical research, AI model development, and internal organisational governance. This work provides practical guidance for researchers to understand data provenance and for organisations to target DQ improvement efforts across the data lifecycle.


翻译:数据质量(DQ)与二次数据的透明度是延缓临床人工智能模型应用并影响临床医生对其信任度的关键因素。许多数据质量研究未能明确质量检查在数据生命周期的哪个阶段进行,导致数据来源和复用适用性存在不确定性。本研究开发了一个用于在临床电子健康记录(EHR)数据生命周期中透明报告数据质量评估的框架。该报告框架通过迭代分析临床数据生命周期的参与主体与阶段而构建。框架区分了数据生成机构与数据接收机构,使用户能够将数据质量参数映射到数据生命周期的各个阶段。该框架定义了5个关键生命周期阶段及多个参与主体。在实际数据集的应用中,该框架展现了其在揭示数据质量问题潜在起源方面的适用性。该框架为报告数据质量评估提供了结构化方法,可增强数据复用适用性的透明度,从而支持可靠的临床研究、人工智能模型开发以及机构内部治理。本工作为研究人员理解数据来源、以及为机构在数据生命周期中有针对性地改进数据质量提供了实践指导。

0
下载
关闭预览

相关内容

数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。有了普遍深入的数据质量,企业在任何时候都可以信任满足所有需求的所有数据。
数据质量维度的实践展开:一项综述
专知会员服务
20+阅读 · 2025年7月28日
利用表示学习推动多机构电子健康记录数据研究
专知会员服务
16+阅读 · 2025年2月17日
国家标准《物联网 数据质量》(征求意见稿)
专知会员服务
52+阅读 · 2022年9月13日
医学影像数据全生命周期管理平台白皮书
专知会员服务
36+阅读 · 2022年8月18日
专知会员服务
52+阅读 · 2021年3月28日
【AI与医学】多模态机器学习精准医疗健康
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
医学知识图谱构建技术与研究进展
全球人工智能
19+阅读 · 2017年11月13日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员