Understanding how data quality aligns with regulatory requirements in machine learning (ML) systems presents a critical challenge for practitioners navigating the evolving EU regulatory landscape. To address this, we first propose a practical framework aligning established data quality dimensions with specific EU regulatory requirements. Second, we conducted a comprehensive online survey with over 180 EU-based data practitioners, investigating their approaches, key challenges, and unmet needs when ensuring data quality in ML systems that align with regulatory requirements. Our findings highlight crucial gaps between current practices and regulatory expectations, underscoring practitioners' need for more integrated data quality tools and better collaboration between technical and legal practitioners. These insights inform recommendations for bridging technical expertise and regulatory compliance, ultimately fostering responsible and trustworthy ML deployments.


翻译:理解数据质量如何与机器学习(ML)系统中的监管要求保持一致,是当前从业者在不断演变的欧盟监管环境下所面临的关键挑战。为此,我们首先提出了一个实用框架,将既有的数据质量维度与具体的欧盟监管要求进行对齐。其次,我们对超过180名位于欧盟的数据从业者开展了一项全面的在线调查,探究他们在确保符合监管要求的机器学习系统数据质量时所采用的方法、面临的主要挑战以及尚未满足的需求。我们的研究结果揭示了当前实践与监管预期之间的关键差距,强调了从业者对更集成化的数据质量工具以及技术从业者与法律从业者之间更好协作的迫切需求。这些见解为弥合技术专长与监管合规之间的鸿沟提供了建议,最终促进负责任且可信赖的机器学习部署。

0
下载
关闭预览

相关内容

数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。有了普遍深入的数据质量,企业在任何时候都可以信任满足所有需求的所有数据。
数据质量维度的实践展开:一项综述
专知会员服务
20+阅读 · 2025年7月28日
工程可信赖的机器学习运维——基于零知识证明
专知会员服务
9+阅读 · 2025年5月27日
不平衡数据学习的全面综述
专知会员服务
44+阅读 · 2025年2月15日
国家标准《物联网 数据质量》(征求意见稿)
专知会员服务
52+阅读 · 2022年9月13日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
机器学习数据集哪里找:优秀数据集来源盘点
云栖社区
12+阅读 · 2019年1月30日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
17+阅读 · 2019年1月24日
机器学习笔试题精选
人工智能头条
13+阅读 · 2018年7月22日
第二章 机器学习中的数学基础
Datartisan数据工匠
12+阅读 · 2018年4月5日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
VIP会员
相关VIP内容
数据质量维度的实践展开:一项综述
专知会员服务
20+阅读 · 2025年7月28日
工程可信赖的机器学习运维——基于零知识证明
专知会员服务
9+阅读 · 2025年5月27日
不平衡数据学习的全面综述
专知会员服务
44+阅读 · 2025年2月15日
国家标准《物联网 数据质量》(征求意见稿)
专知会员服务
52+阅读 · 2022年9月13日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员