A Framework for Transparent Reporting of Data Quality Analysis Across the Clinical Electronic Health Record Data Lifecycle - 专知论文

会员服务 ·

0

数据质量 · 健康 · 分析 · 周期的 · 报告 ·

A Framework for Transparent Reporting of Data Quality Analysis Across the Clinical Electronic Health Record Data Lifecycle

翻译：临床电子健康记录数据生命周期中数据质量分析的透明报告框架

Melinda Wassell,Kerryn Butler-Henderson,Karin Verspoor

from arxiv, 6 pages, 1 figure. Submitted to IoS Press, Studies in Health Technology and Informatics as conference proceedings for AIDH Health Innovation Community Conference Ethics Approval: Royal Melbourne Institute of Technology #26603

Data quality (DQ) and transparency of secondary data are critical factors that delay the adoption of clinical AI models and affect clinician trust in them. Many DQ studies fail to clarify where, along the lifecycle, quality checks occur, leading to uncertainty about provenance and fitness for reuse. This study develops a framework for transparent reporting of DQ assessments across the clinical electronic health record (EHR) data lifecycle. The reporting framework was developed through iterative analysis to identify actors and phases of the clinical data lifecycle. The framework distinguishes between data-generating organizations and data-receiving organizations to allow users to map DQ parameters to stages across the data lifecycle. The framework defines 5 key lifecycle phases and multiple actors. When applied to the real-world dataset, the framework demonstrated applicability in revealing where DQ issues may originate. The framework provides a structured approach for reporting DQ assessments, which can enhance transparency regarding data fitness for reuse, supporting reliable clinical research, AI model development, and internal organisational governance. This work provides practical guidance for researchers to understand data provenance and for organisations to target DQ improvement efforts across the data lifecycle.

翻译：数据质量（DQ）与二次数据的透明度是延缓临床人工智能模型应用并影响临床医生对其信任度的关键因素。许多数据质量研究未能明确质量检查在数据生命周期的哪个阶段进行，导致数据来源和复用适用性存在不确定性。本研究开发了一个用于在临床电子健康记录（EHR）数据生命周期中透明报告数据质量评估的框架。该报告框架通过迭代分析临床数据生命周期的参与主体与阶段而构建。框架区分了数据生成机构与数据接收机构，使用户能够将数据质量参数映射到数据生命周期的各个阶段。该框架定义了5个关键生命周期阶段及多个参与主体。在实际数据集的应用中，该框架展现了其在揭示数据质量问题潜在起源方面的适用性。该框架为报告数据质量评估提供了结构化方法，可增强数据复用适用性的透明度，从而支持可靠的临床研究、人工智能模型开发以及机构内部治理。本工作为研究人员理解数据来源、以及为机构在数据生命周期中有针对性地改进数据质量提供了实践指导。

0

相关内容

数据质量

数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系，高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。有了普遍深入的数据质量，企业在任何时候都可以信任满足所有需求的所有数据。

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

利用表示学习推动多机构电子健康记录数据研究

利用表示学习推动多机构电子健康记录数据研究

专知会员服务

16+阅读 · 2025年2月17日

【牛津大学博士论文】面向电子健康记录的深度学习:风险预测、可解释性和不确定性，200页pdf

【牛津大学博士论文】面向电子健康记录的深度学习:风险预测、可解释性和不确定性，200页pdf

专知会员服务

46+阅读 · 2023年7月18日

国家标准《物联网数据质量》（征求意见稿）

国家标准《物联网数据质量》（征求意见稿）

专知会员服务

52+阅读 · 2022年9月13日

医学影像数据全生命周期管理平台白皮书

医学影像数据全生命周期管理平台白皮书

专知会员服务

36+阅读 · 2022年8月18日

《用于医疗数据的分析和机器学习》佐治亚理工学院137页博士论文

《用于医疗数据的分析和机器学习》佐治亚理工学院137页博士论文

专知会员服务

26+阅读 · 2022年7月21日

【牛津大学】电子医疗记录的生成式对抗网络:应用、评估措施和数据来源综述，A review of Generative Adversarial Networks for Electronic Health Records: applications, evaluation measures and data sources

【牛津大学】电子医疗记录的生成式对抗网络:应用、评估措施和数据来源综述，A review of Generative Adversarial Networks for Electronic Health Records: applications, evaluation measures and data sources

专知会员服务

24+阅读 · 2022年3月15日

AAAI2022最新「时序数据处理」报告，127页PPT阐述时序数据处理以及医疗应用进展

AAAI2022最新「时序数据处理」报告，127页PPT阐述时序数据处理以及医疗应用进展

专知会员服务

89+阅读 · 2022年3月1日

医疗健康大数据隐私保护综述

专知会员服务

52+阅读 · 2021年3月28日

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

专知会员服务

56+阅读 · 2020年6月2日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

Google 医疗 AI 新成果：用深度学习分析电子病历，预测患者病情发展

Google 医疗 AI 新成果：用深度学习分析电子病历，预测患者病情发展

AI掘金志

16+阅读 · 2018年5月9日

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

产业智能官

29+阅读 · 2017年12月10日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

医学知识图谱构建技术与研究进展

医学知识图谱构建技术与研究进展

全球人工智能

19+阅读 · 2017年11月13日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

可扩展的蛋白质组学大数据存储与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

在线检测工件表面质量的“透明窗”方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于文本模式的海量电能质量数据自动分析技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

医疗健康网站信息可信度与质量控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于2-D空间离散数据的质量与产出的预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于透明的医源性感染指标测量的基准研究

国家自然科学基金

0+阅读 · 2014年12月31日

云平台中可优化分析操作的海量医学图像存储管理技术

国家自然科学基金

0+阅读 · 2014年12月31日

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

Arxiv

0+阅读 · 3月9日

Personal Health Data Integration and Intelligence through Semantic Web and Blockchain Technologies

Arxiv

0+阅读 · 3月2日

A multimodal slice discovery framework for systematic failure detection and explanation in medical image classification

Arxiv

0+阅读 · 2月27日

The impact of electronic health records (EHR) data continuity on prediction model fairness and racial-ethnic disparities

Arxiv

0+阅读 · 2月26日

A Secure and Interoperable Architecture for Electronic Health Record Access Control and Sharing

Arxiv

0+阅读 · 2月24日

A feature-stable and explainable machine learning framework for trustworthy decision-making under incomplete clinical data

A feature-stable and explainable machine learning framework for trustworthy decision-making under incomplete clinical data

Arxiv

0+阅读 · 2月19日

Joint Modeling of Longitudinal EHR Data with Shared Random Effects for Informative Visiting and Observation Processes

Arxiv

0+阅读 · 2月17日

MedExChain: Enabling Secure and Efffcient PHR Sharing Across Heterogeneous Blockchains

Arxiv

0+阅读 · 2月12日

Reliable Curation of EHR Dataset via Large Language Models under Environmental Constraints

Arxiv

0+阅读 · 2月12日

CSEval: A Framework for Evaluating Clinical Semantics in Text-to-Image Generation

Arxiv

0+阅读 · 2月12日

VIP会员

文章信息

相关主题

最新内容

【博士论文】迈向可靠神经网络：基于物理结构与贝叶斯不确定性

【博士论文】迈向可靠神经网络：基于物理结构与贝叶斯不确定性

专知会员服务

0+阅读 · 5月1日

《图世界模型：概念、分类体系与未来方向》

《图世界模型：概念、分类体系与未来方向》

专知会员服务

1+阅读 · 5月1日

Palantir AIP平台：连接智能体与决策

Palantir AIP平台：连接智能体与决策

专知会员服务

9+阅读 · 5月1日

《应急响应数字孪生：整合增强现实与实时位置数据的模拟辅助决策》技术报告

《应急响应数字孪生：整合增强现实与实时位置数据的模拟辅助决策》技术报告

专知会员服务

3+阅读 · 5月1日

《通用基于模型的系统工程交会与接近操作任务规划器》130页

《通用基于模型的系统工程交会与接近操作任务规划器》130页

专知会员服务

4+阅读 · 5月1日

对ARL-TR-9623报告《人机自主协同团队信任工具包（HAT³）软件开发文档与用户指南》的增补材料

对ARL-TR-9623报告《人机自主协同团队信任工具包（HAT³）软件开发文档与用户指南》的增补材料

专知会员服务

4+阅读 · 5月1日

《美海军软件测试战略》90页slides

《美海军软件测试战略》90页slides

专知会员服务

8+阅读 · 5月1日

ACL 2026 综述：从事后解释到内生解释，大模型内生可解释性的前沿进展

ACL 2026 综述：从事后解释到内生解释，大模型内生可解释性的前沿进展

专知会员服务

7+阅读 · 4月30日

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

专知会员服务

6+阅读 · 4月30日

面向具身智能与机器人仿真的三维生成：综述

面向具身智能与机器人仿真的三维生成：综述

专知会员服务

9+阅读 · 4月30日

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

18+阅读 · 4月30日

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

7+阅读 · 4月30日

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

12+阅读 · 4月30日

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

8+阅读 · 4月30日

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

9+阅读 · 4月29日

相关VIP内容

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

利用表示学习推动多机构电子健康记录数据研究

利用表示学习推动多机构电子健康记录数据研究

专知会员服务

16+阅读 · 2025年2月17日

【牛津大学博士论文】面向电子健康记录的深度学习:风险预测、可解释性和不确定性，200页pdf

【牛津大学博士论文】面向电子健康记录的深度学习:风险预测、可解释性和不确定性，200页pdf

专知会员服务

46+阅读 · 2023年7月18日

国家标准《物联网数据质量》（征求意见稿）

国家标准《物联网数据质量》（征求意见稿）

专知会员服务

52+阅读 · 2022年9月13日

医学影像数据全生命周期管理平台白皮书

医学影像数据全生命周期管理平台白皮书

专知会员服务

36+阅读 · 2022年8月18日

《用于医疗数据的分析和机器学习》佐治亚理工学院137页博士论文

《用于医疗数据的分析和机器学习》佐治亚理工学院137页博士论文

专知会员服务

26+阅读 · 2022年7月21日

【牛津大学】电子医疗记录的生成式对抗网络:应用、评估措施和数据来源综述，A review of Generative Adversarial Networks for Electronic Health Records: applications, evaluation measures and data sources

【牛津大学】电子医疗记录的生成式对抗网络:应用、评估措施和数据来源综述，A review of Generative Adversarial Networks for Electronic Health Records: applications, evaluation measures and data sources

专知会员服务

24+阅读 · 2022年3月15日

AAAI2022最新「时序数据处理」报告，127页PPT阐述时序数据处理以及医疗应用进展

AAAI2022最新「时序数据处理」报告，127页PPT阐述时序数据处理以及医疗应用进展

专知会员服务

89+阅读 · 2022年3月1日

医疗健康大数据隐私保护综述

专知会员服务

52+阅读 · 2021年3月28日

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

【斯坦福】从电子病历EHR构建知识图谱，Robustly Extracting Medical Knowledge from EHRs:A Case Study of Learning a Health Knowledge Graph

专知会员服务

56+阅读 · 2020年6月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《图世界模型：概念、分类体系与未来方向》

《应急响应数字孪生：整合增强现实与实时位置数据的模拟辅助决策》技术报告

【博士论文】迈向可靠神经网络：基于物理结构与贝叶斯不确定性

Palantir AIP平台：连接智能体与决策

相关资讯

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

《利用多模态移动传感器数据对健康进行建模的机器学习》剑桥大学博士论文

专知

16+阅读 · 2022年5月3日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

Google 医疗 AI 新成果：用深度学习分析电子病历，预测患者病情发展

Google 医疗 AI 新成果：用深度学习分析电子病历，预测患者病情发展

AI掘金志

16+阅读 · 2018年5月9日

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

【智能医疗】【知识图谱】中文电子病历命名实体识别的主动学习方法 | 病历智能分析系统的研究与实现 | 临床路径知识建模研究

产业智能官

29+阅读 · 2017年12月10日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

医学知识图谱构建技术与研究进展

医学知识图谱构建技术与研究进展

全球人工智能

19+阅读 · 2017年11月13日

相关论文

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

Arxiv

0+阅读 · 3月9日

Personal Health Data Integration and Intelligence through Semantic Web and Blockchain Technologies

Arxiv

0+阅读 · 3月2日

A multimodal slice discovery framework for systematic failure detection and explanation in medical image classification

Arxiv

0+阅读 · 2月27日

The impact of electronic health records (EHR) data continuity on prediction model fairness and racial-ethnic disparities

Arxiv

0+阅读 · 2月26日

A Secure and Interoperable Architecture for Electronic Health Record Access Control and Sharing

Arxiv

0+阅读 · 2月24日

A feature-stable and explainable machine learning framework for trustworthy decision-making under incomplete clinical data

A feature-stable and explainable machine learning framework for trustworthy decision-making under incomplete clinical data

Arxiv

0+阅读 · 2月19日

Joint Modeling of Longitudinal EHR Data with Shared Random Effects for Informative Visiting and Observation Processes

Arxiv

0+阅读 · 2月17日

MedExChain: Enabling Secure and Efffcient PHR Sharing Across Heterogeneous Blockchains

Arxiv

0+阅读 · 2月12日

Reliable Curation of EHR Dataset via Large Language Models under Environmental Constraints

Arxiv

0+阅读 · 2月12日

CSEval: A Framework for Evaluating Clinical Semantics in Text-to-Image Generation

Arxiv

0+阅读 · 2月12日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

可扩展的蛋白质组学大数据存储与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

在线检测工件表面质量的“透明窗”方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于文本模式的海量电能质量数据自动分析技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

医疗健康网站信息可信度与质量控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于2-D空间离散数据的质量与产出的预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于透明的医源性感染指标测量的基准研究

国家自然科学基金

0+阅读 · 2014年12月31日

云平台中可优化分析操作的海量医学图像存储管理技术

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员