Evaluating Data Quality Tools: Measurement Capabilities and LLM Integration - 专知论文

会员服务 ·

0

工具 · 集成 · 语言模型 · 数据质量 · 模型集 ·

Evaluating Data Quality Tools: Measurement Capabilities and LLM Integration

翻译：评估数据质量工具：测量能力与大语言模型集成

Tobias Rehberger,Thomas Hütter,Lisa Ehrlinger,Wolfram Wöß

High data quality is critical for reliable analytics and operational efficiency. A growing ecosystem of tools has emerged to support data quality management, ranging from lightweight open-source libraries to comprehensive enterprise platforms. This paper evaluates six data quality tools: Great Expectations, Deequ, Evidently, Informatica, Experian, and Ataccama. The evaluation criteria cover rule definition, duplicate detection, metric aggregation, and uncertainty handling, and were derived from real-world use cases of company partners. We further examine to what extent these tools integrate Large Language Models (LLMs). Our findings show that proprietary tools offer more comprehensive measurement features and emerging LLM-based assistance, while open-source tools provide flexibility at the cost of higher implementation effort. Across all tools, LLM integration remains limited to rule creation workflows. Direct data validation through LLMs is not yet supported by any of the evaluated tools.

翻译：高质量数据对于可靠分析与运营效率至关重要。为支持数据质量管理，从轻量级开源库到综合企业平台的相关工具生态系统日益壮大。本文评估了六款数据质量工具：Great Expectations、Deequ、Evidently、Informatica、Experian 及 Ataccama。评估标准涵盖规则定义、重复检测、指标聚合及不确定性处理，并基于企业合作伙伴的实际应用案例提炼而成。我们进一步考察了这些工具在多大程度上集成大语言模型（LLM）。研究结果表明：专有工具提供更全面的测量功能与新兴的基于大语言模型的辅助能力，而开源工具则具备灵活性，但需付出更高的实施成本。在所有工具中，大语言模型的集成仍局限于规则创建工作流程；目前尚无任何被评估工具支持通过大语言模型直接进行数据验证。

0

相关内容

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

【新书】使用大型语言模型进行数据分析：文本、表格、图像与音频

【新书】使用大型语言模型进行数据分析：文本、表格、图像与音频

专知会员服务

43+阅读 · 2025年4月16日

《大语言模型的数据合成与增强综述》

《大语言模型的数据合成与增强综述》

专知会员服务

44+阅读 · 2024年10月19日

基于大语言模型（LLM）的合成数据生成、策展和评估的综述

基于大语言模型（LLM）的合成数据生成、策展和评估的综述

专知会员服务

62+阅读 · 2024年7月5日

大模型如何利用数据？北大华为等最新《大型语言模型的数据管理》综述

大模型如何利用数据？北大华为等最新《大型语言模型的数据管理》综述

专知会员服务

99+阅读 · 2023年12月6日

如何评估大模型？吉大微软亚研等最新《大型语言模型评估》综述，全面阐述大模型评估方法体系

如何评估大模型？吉大微软亚研等最新《大型语言模型评估》综述，全面阐述大模型评估方法体系

专知会员服务

88+阅读 · 2023年7月13日

国家标准《物联网数据质量》（征求意见稿）

国家标准《物联网数据质量》（征求意见稿）

专知会员服务

52+阅读 · 2022年9月13日

工信部发布《质量大数据白皮书》，178页pdf

工信部发布《质量大数据白皮书》，178页pdf

专知会员服务

95+阅读 · 2022年7月12日

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

专知会员服务

27+阅读 · 2022年3月24日

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

专知会员服务

31+阅读 · 2020年1月11日

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

【干货】20大推荐系统公共数据集分享

【干货】20大推荐系统公共数据集分享

机器学习与推荐算法

68+阅读 · 2020年3月13日

文本生成公开数据集/开源工具/经典论文详细列表分享

文本生成公开数据集/开源工具/经典论文详细列表分享

深度学习与NLP

30+阅读 · 2019年9月22日

最全中文自然语言处理数据集、平台和工具整理

最全中文自然语言处理数据集、平台和工具整理

深度学习与NLP

34+阅读 · 2019年6月22日

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

36大数据

13+阅读 · 2019年3月20日

【大数据】大数据参考架构和关键技术（综合）

【大数据】大数据参考架构和关键技术（综合）

产业智能官

14+阅读 · 2018年11月22日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

【资源】史上最全数据集汇总

【资源】史上最全数据集汇总

七月在线实验室

18+阅读 · 2018年4月24日

【工业大数据】35页PPT讲解：工业大数据特点、价值及其计算

【工业大数据】35页PPT讲解：工业大数据特点、价值及其计算

产业智能官

10+阅读 · 2018年1月20日

管理决策大数据分析方法与关键技术

国家自然科学基金

8+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于粒计算的大数据特征融合理论与方法

国家自然科学基金

8+阅读 · 2015年12月31日

适应于大数据特性的智能存储技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

流程监控与评估中多元数据整合研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据的环境绩效评价理论、方法及其应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

DataClaw: An Autonomous Data Agent with Instant Messaging Integration

Arxiv

0+阅读 · 4月27日

Dynamic Model Routing and Cascading for Efficient LLM Inference: A Survey

Arxiv

1+阅读 · 4月21日

UniToolCall: Unifying Tool-Use Representation, Data, and Evaluation for LLM Agents

Arxiv

0+阅读 · 4月13日

Large language models for post-publication research evaluation: Evidence from expert recommendations and citation indicators

Arxiv

0+阅读 · 3月27日

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Arxiv

0+阅读 · 3月16日

DARE-bench: Evaluating Modeling and Instruction Fidelity of LLMs in Data Science

Arxiv

0+阅读 · 2月27日

On Data Engineering for Scaling LLM Terminal Capabilities

Arxiv

0+阅读 · 2月24日

Qualitative Coding Analysis through Open-Source Large Language Models: A User Study and Design Recommendations

Arxiv

0+阅读 · 2月20日

Data Management For Large Language Models: A Survey

Arxiv

17+阅读 · 2023年12月4日

Trends in Integration of Knowledge and Large Language Models: A Survey and Taxonomy of Methods, Benchmarks, and Applications

Arxiv

19+阅读 · 2023年11月10日

VIP会员

文章信息

相关主题

最新内容

现代战争的隐蔽系统：伊朗战争十大启示

现代战争的隐蔽系统：伊朗战争十大启示

专知会员服务

0+阅读 · 今天3:58

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

3+阅读 · 6月26日

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

4+阅读 · 6月26日

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

12+阅读 · 6月26日

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

5+阅读 · 6月26日

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

4+阅读 · 6月26日

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

3+阅读 · 6月26日

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

9+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

相关VIP内容

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

【新书】使用大型语言模型进行数据分析：文本、表格、图像与音频

【新书】使用大型语言模型进行数据分析：文本、表格、图像与音频

专知会员服务

43+阅读 · 2025年4月16日

《大语言模型的数据合成与增强综述》

《大语言模型的数据合成与增强综述》

专知会员服务

44+阅读 · 2024年10月19日

基于大语言模型（LLM）的合成数据生成、策展和评估的综述

基于大语言模型（LLM）的合成数据生成、策展和评估的综述

专知会员服务

62+阅读 · 2024年7月5日

大模型如何利用数据？北大华为等最新《大型语言模型的数据管理》综述

大模型如何利用数据？北大华为等最新《大型语言模型的数据管理》综述

专知会员服务

99+阅读 · 2023年12月6日

如何评估大模型？吉大微软亚研等最新《大型语言模型评估》综述，全面阐述大模型评估方法体系

如何评估大模型？吉大微软亚研等最新《大型语言模型评估》综述，全面阐述大模型评估方法体系

专知会员服务

88+阅读 · 2023年7月13日

国家标准《物联网数据质量》（征求意见稿）

国家标准《物联网数据质量》（征求意见稿）

专知会员服务

52+阅读 · 2022年9月13日

工信部发布《质量大数据白皮书》，178页pdf

工信部发布《质量大数据白皮书》，178页pdf

专知会员服务

95+阅读 · 2022年7月12日

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

专知会员服务

27+阅读 · 2022年3月24日

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

专知会员服务

31+阅读 · 2020年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

无人机自主控制与人工智能：系统性综述

现代战争的隐蔽系统：伊朗战争十大启示

GNN跨域综述：从消息传递到图基础模型

相关资讯

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

【干货】20大推荐系统公共数据集分享

【干货】20大推荐系统公共数据集分享

机器学习与推荐算法

68+阅读 · 2020年3月13日

文本生成公开数据集/开源工具/经典论文详细列表分享

文本生成公开数据集/开源工具/经典论文详细列表分享

深度学习与NLP

30+阅读 · 2019年9月22日

最全中文自然语言处理数据集、平台和工具整理

最全中文自然语言处理数据集、平台和工具整理

深度学习与NLP

34+阅读 · 2019年6月22日

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

实战▍一个完整的电信客服分析平台大数据项目：架构、实现、数据

36大数据

13+阅读 · 2019年3月20日

【大数据】大数据参考架构和关键技术（综合）

【大数据】大数据参考架构和关键技术（综合）

产业智能官

14+阅读 · 2018年11月22日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

【资源】史上最全数据集汇总

【资源】史上最全数据集汇总

七月在线实验室

18+阅读 · 2018年4月24日

【工业大数据】35页PPT讲解：工业大数据特点、价值及其计算

【工业大数据】35页PPT讲解：工业大数据特点、价值及其计算

产业智能官

10+阅读 · 2018年1月20日

相关论文

DataClaw: An Autonomous Data Agent with Instant Messaging Integration

Arxiv

0+阅读 · 4月27日

Dynamic Model Routing and Cascading for Efficient LLM Inference: A Survey

Arxiv

1+阅读 · 4月21日

UniToolCall: Unifying Tool-Use Representation, Data, and Evaluation for LLM Agents

Arxiv

0+阅读 · 4月13日

Large language models for post-publication research evaluation: Evidence from expert recommendations and citation indicators

Arxiv

0+阅读 · 3月27日

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Arxiv

0+阅读 · 3月16日

DARE-bench: Evaluating Modeling and Instruction Fidelity of LLMs in Data Science

Arxiv

0+阅读 · 2月27日

On Data Engineering for Scaling LLM Terminal Capabilities

Arxiv

0+阅读 · 2月24日

Qualitative Coding Analysis through Open-Source Large Language Models: A User Study and Design Recommendations

Arxiv

0+阅读 · 2月20日

Data Management For Large Language Models: A Survey

Arxiv

17+阅读 · 2023年12月4日

Trends in Integration of Knowledge and Large Language Models: A Survey and Taxonomy of Methods, Benchmarks, and Applications

Arxiv

19+阅读 · 2023年11月10日

相关基金

管理决策大数据分析方法与关键技术

国家自然科学基金

8+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于粒计算的大数据特征融合理论与方法

国家自然科学基金

8+阅读 · 2015年12月31日

适应于大数据特性的智能存储技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

流程监控与评估中多元数据整合研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据的环境绩效评价理论、方法及其应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员