Quality of Descriptive Information on Cultural Heritage Objects: Definition and Empirical Evaluation - 专知论文

会员服务 ·

0

数据质量 · 不一致性 · 一致 · 不确定 · 使用情境 ·

Quality of Descriptive Information on Cultural Heritage Objects: Definition and Empirical Evaluation

翻译：文化遗产对象描述信息的质量：定义与实证评估

Markus Matoni,Arno Kesper,Gabriele Taentzer

from arxiv, preprint

Effective data processing depends on the quality of the underlying data. However, quality issues such as inconsistencies and uncertainties, can significantly impede the processing and subsequent use of data. Despite the centrality of data quality to a wide range of computational tasks, there is currently no broadly accepted, domain-independent consensus on the definition of data quality. Existing frameworks primarily define data quality in ways that are tailored to specific domains, data types, or contexts of use. Although quality assessment frameworks exist for specific domains, such as electronic health record data and linked data, corresponding approaches for descriptive information about cultural heritage objects remain underdeveloped. Moreover, existing quality definitions are often theoretical in nature and lack empirical validation based on real-world data problems. In this paper, we address these limitations by first defining a set of quality dimensions specifically designed to capture the characteristics of descriptive information about cultural heritage objects. Our definition is based on an in-depth analysis of existing dimensions and is illustrated through domain-specific examples. We then evaluate the practical applicability of our proposed quality definition using a curated set of real-world data quality problems from the cultural heritage domain. This empirical evaluation substantiates our definition of data quality, resulting in a comprehensive definition of data quality in this domain.

翻译：有效的数据处理依赖于基础数据的质量。然而，诸如不一致性和不确定性等质量问题会严重阻碍数据的处理及后续使用。尽管数据质量对广泛的计算任务至关重要，但目前尚未就数据质量的定义达成广泛接受、独立于领域的共识。现有框架主要以针对特定领域、数据类型或使用情境的方式定义数据质量。尽管存在针对特定领域的质量评估框架，例如电子健康记录数据和关联数据，但针对文化遗产对象描述信息的相应方法仍不完善。此外，现有的质量定义往往本质上是理论性的，缺乏基于现实世界数据问题的实证验证。在本文中，我们首先通过定义一组专门设计用于捕捉文化遗产对象描述信息特征的质量维度来应对这些局限性。我们的定义基于对现有维度的深入分析，并通过领域特定示例进行阐释。随后，我们使用来自文化遗产领域的一组精心筛选的真实世界数据质量问题，评估了我们所提出的质量定义的实际适用性。这一实证评估证实了我们的数据质量定义，从而得出了该领域数据质量的全面定义。

0

相关内容

数据质量

数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系，高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。有了普遍深入的数据质量，企业在任何时候都可以信任满足所有需求的所有数据。

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

视频质量评价研究综述

视频质量评价研究综述

专知会员服务

27+阅读 · 2023年10月10日

重磅！国家标准《信息安全技术数据安全风险评估方法》（征求意见稿）发布

重磅！国家标准《信息安全技术数据安全风险评估方法》（征求意见稿）发布

专知会员服务

29+阅读 · 2023年9月3日

国家标准《物联网数据质量》（征求意见稿）

国家标准《物联网数据质量》（征求意见稿）

专知会员服务

52+阅读 · 2022年9月13日

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知会员服务

42+阅读 · 2022年9月9日

国家标准《信息技术大数据数据治理实施指南》（征求意见稿）

国家标准《信息技术大数据数据治理实施指南》（征求意见稿）

专知会员服务

74+阅读 · 2022年9月8日

工信部发布《质量大数据白皮书》，178页pdf

工信部发布《质量大数据白皮书》，178页pdf

专知会员服务

95+阅读 · 2022年7月12日

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

专知会员服务

51+阅读 · 2022年5月31日

图像与视频质量评价综述

专知会员服务

34+阅读 · 2021年9月29日

【博士论文】软件系统网络化建模、质量度量与保证

专知会员服务

14+阅读 · 2020年12月17日

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

专知

32+阅读 · 2022年11月16日

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

AINLP

19+阅读 · 2020年6月14日

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

专知

10+阅读 · 2020年3月9日

一行命令搞定图像质量评价

一行命令搞定图像质量评价

计算机视觉life

12+阅读 · 2019年12月31日

无参考图像质量评价研究进展综述

无参考图像质量评价研究进展综述

人工智能前沿讲习班

47+阅读 · 2019年2月15日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

【大数据】数据挖掘与数据分析知识流程梳理

【大数据】数据挖掘与数据分析知识流程梳理

产业智能官

13+阅读 · 2017年9月22日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

量质融合的移动轨迹相似性查询技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

基于“投入-产出”的专业学位质量评估模型的构建与实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

装备作战需求论证质量评估方法研究

国家自然科学基金

34+阅读 · 2012年12月31日

Uncertainty Quantification and Data Efficiency in AI: An Information-Theoretic Perspective

Arxiv

0+阅读 · 3月14日

A survey of diversity quantification in natural language processing: The why, what, where and how

Arxiv

0+阅读 · 3月13日

Assessment of Spatio-Temporal Predictors in the Presence of Missing and Heterogeneous Data

Arxiv

0+阅读 · 2月27日

Seeing Through Words: Controlling Visual Retrieval Quality with Language Models

Arxiv

0+阅读 · 2月24日

Statistical Confidence in Functional Correctness: An Approach for AI Product Functional Correctness Evaluation

Arxiv

0+阅读 · 2月20日

Calibrated and uncertain? Evaluating uncertainty estimates in binary classification models

Arxiv

0+阅读 · 2月17日

Advancing Software Quality: A Standards-Focused Review of LLM-Based Assurance Techniques

Arxiv

0+阅读 · 2月15日

ExtractBench: A Benchmark and Evaluation Methodology for Complex Structured Extraction

Arxiv

0+阅读 · 2月12日

Estimating the Value of Evidence-Based Decision Making

Arxiv

0+阅读 · 2月9日

Data Management For Large Language Models: A Survey

Arxiv

17+阅读 · 2023年12月4日

VIP会员

文章信息

相关主题

最新内容

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

8+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

3+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

7+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

7+阅读 · 7月22日

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

15+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

13+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

9+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

7+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

9+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

8+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

10+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

9+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

10+阅读 · 7月20日

相关VIP内容

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

视频质量评价研究综述

视频质量评价研究综述

专知会员服务

27+阅读 · 2023年10月10日

重磅！国家标准《信息安全技术数据安全风险评估方法》（征求意见稿）发布

重磅！国家标准《信息安全技术数据安全风险评估方法》（征求意见稿）发布

专知会员服务

29+阅读 · 2023年9月3日

国家标准《物联网数据质量》（征求意见稿）

国家标准《物联网数据质量》（征求意见稿）

专知会员服务

52+阅读 · 2022年9月13日

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知会员服务

42+阅读 · 2022年9月9日

国家标准《信息技术大数据数据治理实施指南》（征求意见稿）

国家标准《信息技术大数据数据治理实施指南》（征求意见稿）

专知会员服务

74+阅读 · 2022年9月8日

工信部发布《质量大数据白皮书》，178页pdf

工信部发布《质量大数据白皮书》，178页pdf

专知会员服务

95+阅读 · 2022年7月12日

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

专知会员服务

51+阅读 · 2022年5月31日

图像与视频质量评价综述

专知会员服务

34+阅读 · 2021年9月29日

【博士论文】软件系统网络化建模、质量度量与保证

专知会员服务

14+阅读 · 2020年12月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

对抗环境下超视距目标打击的情报支援

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

相关资讯

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

专知

32+阅读 · 2022年11月16日

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

AINLP

19+阅读 · 2020年6月14日

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

专知

10+阅读 · 2020年3月9日

一行命令搞定图像质量评价

一行命令搞定图像质量评价

计算机视觉life

12+阅读 · 2019年12月31日

无参考图像质量评价研究进展综述

无参考图像质量评价研究进展综述

人工智能前沿讲习班

47+阅读 · 2019年2月15日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

【大数据】数据挖掘与数据分析知识流程梳理

【大数据】数据挖掘与数据分析知识流程梳理

产业智能官

13+阅读 · 2017年9月22日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

相关论文

Uncertainty Quantification and Data Efficiency in AI: An Information-Theoretic Perspective

Arxiv

0+阅读 · 3月14日

A survey of diversity quantification in natural language processing: The why, what, where and how

Arxiv

0+阅读 · 3月13日

Assessment of Spatio-Temporal Predictors in the Presence of Missing and Heterogeneous Data

Arxiv

0+阅读 · 2月27日

Seeing Through Words: Controlling Visual Retrieval Quality with Language Models

Arxiv

0+阅读 · 2月24日

Statistical Confidence in Functional Correctness: An Approach for AI Product Functional Correctness Evaluation

Arxiv

0+阅读 · 2月20日

Calibrated and uncertain? Evaluating uncertainty estimates in binary classification models

Arxiv

0+阅读 · 2月17日

Advancing Software Quality: A Standards-Focused Review of LLM-Based Assurance Techniques

Arxiv

0+阅读 · 2月15日

ExtractBench: A Benchmark and Evaluation Methodology for Complex Structured Extraction

Arxiv

0+阅读 · 2月12日

Estimating the Value of Evidence-Based Decision Making

Arxiv

0+阅读 · 2月9日

Data Management For Large Language Models: A Survey

Arxiv

17+阅读 · 2023年12月4日

相关基金

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

量质融合的移动轨迹相似性查询技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

基于“投入-产出”的专业学位质量评估模型的构建与实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

装备作战需求论证质量评估方法研究

国家自然科学基金

34+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员