A Framework and Prototype for a Navigable Map of Datasets in Engineering Design and Systems Engineering - 专知论文

会员服务 ·

0

系统 · 数据集 · 设计 · 构建 · 工具 ·

A Framework and Prototype for a Navigable Map of Datasets in Engineering Design and Systems Engineering

翻译：工程设计与系统工程中数据集导航地图的框架与原型

H. Sinan Bank,Daniel R. Herber

from arxiv, 10 pages, 3 figures, Submitted to ASME IDETC 2026-DAC22

The proliferation of data across the system lifecycle presents both a significant opportunity and a challenge for Engineering Design and Systems Engineering (EDSE). While this ``digital thread'' has the potential to drive innovation, the fragmented and inaccessible nature of existing datasets hinders method validation, limits reproducibility, and slows research progress. Unlike fields such as computer vision and natural language processing, which benefit from established benchmark ecosystems, engineering design research often relies on small, proprietary, or ad-hoc datasets. This paper addresses this challenge by proposing a systematic framework for a ``Map of Datasets in EDSE.'' The framework is built upon a multi-dimensional taxonomy designed to classify engineering datasets by domain, lifecycle stage, data type, and format, enabling faceted discovery. An architecture for an interactive discovery tool is detailed and demonstrated through a working prototype, employing a knowledge graph data model to capture rich semantic relationships between datasets, tools, and publications. An analysis of the current data landscape reveals underrepresented areas (``data deserts'') in early-stage design and system architecture, as well as relatively well-represented areas (``data oases'') in predictive maintenance and autonomous systems. The paper identifies key challenges in curation and sustainability and proposes mitigation strategies, laying the groundwork for a dynamic, community-driven resource to accelerate data-centric engineering research.

翻译：系统生命周期中数据的激增为工程设计与系统工程（EDSE）带来了重大机遇与挑战。尽管这种"数字主线"具有推动创新的潜力，但现有数据集的碎片化与难以访问性阻碍了方法验证、限制了可复现性并减缓了研究进展。与计算机视觉和自然语言处理等受益于成熟基准生态系统的领域不同，工程设计研究往往依赖于小型、专有或临时构建的数据集。本文通过提出一个"EDSE数据集地图"的系统性框架来应对这一挑战。该框架建立在多维分类法之上，旨在通过领域、生命周期阶段、数据类型和格式对工程数据集进行分类，从而实现分面检索。本文详细阐述了一种交互式检索工具的架构，并通过一个可运行的原型进行演示，该原型采用知识图谱数据模型来捕获数据集、工具与文献之间丰富的语义关系。对当前数据版图的分析揭示了早期设计与系统架构中代表性不足的领域（"数据荒漠"），以及预测性维护和自主系统中相对充分覆盖的领域（"数据绿洲"）。本文指出了数据策管与可持续性方面的关键挑战，并提出了缓解策略，为构建动态的、社区驱动的资源以加速以数据为中心的工程研究奠定了基础。

0

相关内容

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

专知会员服务

27+阅读 · 2025年8月24日

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

专知会员服务

29+阅读 · 2025年1月4日

图上如何提示？港中文等最新《图提示学习》全面综述，详述图提示分类体系

图上如何提示？港中文等最新《图提示学习》全面综述，详述图提示分类体系

专知会员服务

42+阅读 · 2023年12月1日

面向关系型数据与知识图谱的数据集成技术综述

面向关系型数据与知识图谱的数据集成技术综述

专知会员服务

53+阅读 · 2022年12月30日

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

专知会员服务

80+阅读 · 2022年10月7日

【2022新书】数据工程基础计划和建立鲁棒的数据系统，446页pdf

【2022新书】数据工程基础计划和建立鲁棒的数据系统，446页pdf

专知会员服务

84+阅读 · 2022年8月7日

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

专知会员服务

50+阅读 · 2022年3月27日

《数据驱动的科学与工程——机器学习、动力系统与控制》，572页pdf

《数据驱动的科学与工程——机器学习、动力系统与控制》，572页pdf

专知会员服务

199+阅读 · 2021年2月17日

工程领域大数据和人工智能原则

专知会员服务

127+阅读 · 2020年3月26日

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

专知会员服务

14+阅读 · 2019年10月25日

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

60+阅读 · 2023年4月6日

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

19+阅读 · 2022年10月23日

知识图谱如何落地？Neo4j这本《知识图谱:数据业务应用》书为你讲述如何构建和使用知识图谱，87页pdf

知识图谱如何落地？Neo4j这本《知识图谱:数据业务应用》书为你讲述如何构建和使用知识图谱，87页pdf

专知

28+阅读 · 2022年2月18日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

36+阅读 · 2022年1月8日

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

专知

16+阅读 · 2020年1月3日

【MBSE】基于模型的系统工程在航空发动机控制设计中的应用

【MBSE】基于模型的系统工程在航空发动机控制设计中的应用

产业智能官

23+阅读 · 2019年7月3日

基于模型系统的系统设计

基于模型系统的系统设计

科技导报

10+阅读 · 2019年4月25日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

【干货】理解特征工程Part 2——类别数据（附代码）

【干货】理解特征工程Part 2——类别数据（附代码）

专知

16+阅读 · 2018年6月8日

数据驱动的航空运输系统多层结构及韧性研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于格型结构与CS理论的高效数字系统设计与实现研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于数据特征选择与匹配的工业过程监测方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

基于“数字链”系统的建筑设计与数控建造

国家自然科学基金

2+阅读 · 2014年12月31日

Design-OS: A Specification-Driven Framework for Engineering System Design with a Control-Systems Design Case

Arxiv

0+阅读 · 5月3日

Data-Oriented Modeling for Spacecraft Design

Arxiv

0+阅读 · 3月25日

Design-OS: A Specification-Driven Framework for Engineering System Design with a Control-Systems Design Case

Arxiv

0+阅读 · 3月20日

Literature Study on Operational Data Analytics Frameworks in Large-scale Computing Infrastructures

Arxiv

0+阅读 · 3月19日

A Framework and Prototype for a Navigable Map of Datasets in Engineering Design and Systems Engineering

Arxiv

0+阅读 · 3月18日

AutoDataset: A Lightweight System for Continuous Dataset Discovery and Search

Arxiv

0+阅读 · 3月7日

A Data-Driven Analysis for Engineering Conferences: The Institute of Industrial and Systems Engineering (IISE) Annual Conference Proceedings (2002-2025)

Arxiv

0+阅读 · 3月3日

ReSearch: A Multi-Stage Machine Learning Framework for Earth Science Data Discovery

Arxiv

0+阅读 · 3月2日

Graph-centric Cross-model Data Integration and Analytics in a Unified Multi-model Database

Arxiv

0+阅读 · 3月2日

A Data-Driven Analysis for Engineering Conferences: The Institute of Industrial and Systems Engineering (IISE) Annual Conference Proceedings (2002-2005)

Arxiv

0+阅读 · 2月28日

VIP会员

文章信息

相关主题

最新内容

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

8+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

6+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

19+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

相关VIP内容

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

专知会员服务

27+阅读 · 2025年8月24日

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

专知会员服务

29+阅读 · 2025年1月4日

图上如何提示？港中文等最新《图提示学习》全面综述，详述图提示分类体系

图上如何提示？港中文等最新《图提示学习》全面综述，详述图提示分类体系

专知会员服务

42+阅读 · 2023年12月1日

面向关系型数据与知识图谱的数据集成技术综述

面向关系型数据与知识图谱的数据集成技术综述

专知会员服务

53+阅读 · 2022年12月30日

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

【干货书】图数据科学：图算法，分析方法，平台，数据库，和用例，415页pdf

专知会员服务

80+阅读 · 2022年10月7日

【2022新书】数据工程基础计划和建立鲁棒的数据系统，446页pdf

【2022新书】数据工程基础计划和建立鲁棒的数据系统，446页pdf

专知会员服务

84+阅读 · 2022年8月7日

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

专知会员服务

50+阅读 · 2022年3月27日

《数据驱动的科学与工程——机器学习、动力系统与控制》，572页pdf

《数据驱动的科学与工程——机器学习、动力系统与控制》，572页pdf

专知会员服务

199+阅读 · 2021年2月17日

工程领域大数据和人工智能原则

专知会员服务

127+阅读 · 2020年3月26日

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

From Data to Model Programming: Injecting Structured Priors for Knowledge Extraction，南加州大学计算机科学系任翔助理教授，CIPS ATT 16（2019）

专知会员服务

14+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

相关资讯

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

60+阅读 · 2023年4月6日

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

19+阅读 · 2022年10月23日

知识图谱如何落地？Neo4j这本《知识图谱:数据业务应用》书为你讲述如何构建和使用知识图谱，87页pdf

知识图谱如何落地？Neo4j这本《知识图谱:数据业务应用》书为你讲述如何构建和使用知识图谱，87页pdf

专知

28+阅读 · 2022年2月18日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

36+阅读 · 2022年1月8日

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

专知

16+阅读 · 2020年1月3日

【MBSE】基于模型的系统工程在航空发动机控制设计中的应用

【MBSE】基于模型的系统工程在航空发动机控制设计中的应用

产业智能官

23+阅读 · 2019年7月3日

基于模型系统的系统设计

基于模型系统的系统设计

科技导报

10+阅读 · 2019年4月25日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

【干货】理解特征工程Part 2——类别数据（附代码）

【干货】理解特征工程Part 2——类别数据（附代码）

专知

16+阅读 · 2018年6月8日

相关论文

Design-OS: A Specification-Driven Framework for Engineering System Design with a Control-Systems Design Case

Arxiv

0+阅读 · 5月3日

Data-Oriented Modeling for Spacecraft Design

Arxiv

0+阅读 · 3月25日

Design-OS: A Specification-Driven Framework for Engineering System Design with a Control-Systems Design Case

Arxiv

0+阅读 · 3月20日

Literature Study on Operational Data Analytics Frameworks in Large-scale Computing Infrastructures

Arxiv

0+阅读 · 3月19日

A Framework and Prototype for a Navigable Map of Datasets in Engineering Design and Systems Engineering

Arxiv

0+阅读 · 3月18日

AutoDataset: A Lightweight System for Continuous Dataset Discovery and Search

Arxiv

0+阅读 · 3月7日

A Data-Driven Analysis for Engineering Conferences: The Institute of Industrial and Systems Engineering (IISE) Annual Conference Proceedings (2002-2025)

Arxiv

0+阅读 · 3月3日

ReSearch: A Multi-Stage Machine Learning Framework for Earth Science Data Discovery

Arxiv

0+阅读 · 3月2日

Graph-centric Cross-model Data Integration and Analytics in a Unified Multi-model Database

Arxiv

0+阅读 · 3月2日

A Data-Driven Analysis for Engineering Conferences: The Institute of Industrial and Systems Engineering (IISE) Annual Conference Proceedings (2002-2005)

Arxiv

0+阅读 · 2月28日

相关基金

数据驱动的航空运输系统多层结构及韧性研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于格型结构与CS理论的高效数字系统设计与实现研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于数据特征选择与匹配的工业过程监测方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

基于“数字链”系统的建筑设计与数控建造

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员