yProv4DV: Reproducible Data Visualization Scripts Out of the Box - 专知论文

会员服务 ·

0

yProv4DV: Reproducible Data Visualization Scripts Out of the Box

翻译：yProv4DV：开箱即用的可复现数据可视化脚本

Gabriele Padovani,Sandro Fiore

from arxiv, SoftwareX, 17 pages, 4 figures

While results visualization is a critical phase to the communication of new academic results, plots are frequently shared without the complete combination of code, input data, execution context and outputs required to independently reproduce the resulting figures. Existing reproducibility solutions tend to focus on computational pipelines or workflow management systems, not covering script-based visualization practices commonly used by researchers and practitioners. Additionally, the minimalist nature of current Python data visualization libraries tend to speed up the creation of images, disincentivizing users from spending time integrating additional tools into these short scripts. This paper proposes yProv4DV, a library lightweight designed to enable reproducible data visualization scripts through the use of provenance information, minimizing the necessity for code modifications. Through a single call, users can track inputs, outputs and source code files, enabling saving and full reproducibility of their data visualization software. As a result, this library fills a gap in reproducible research workflows by addressing the reproducibility of plots in scientific publications.

翻译：虽然结果可视化是学术成果传播的关键环节，但图表在分享时往往缺少独立复现所需代码、输入数据、执行环境与输出结果的完整组合。现有可复现性解决方案多聚焦于计算流程或工作流管理系统，未能覆盖研究人员和从业者常用的基于脚本的可视化实践。此外，当前Python数据可视化库的极简特性虽加速了图像生成，却削弱了用户在这些简短脚本中集成额外工具的意愿。本文提出轻量级库yProv4DV，通过利用来源信息实现可复现的数据可视化脚本，最大程度减少代码修改需求。用户仅需单次调用即可追踪输入、输出及源代码文件，实现数据可视化软件的保存与完整可复现性。该库通过解决科学出版物中图表复现问题，填补了可复现研究工作流程中的空白。

0

相关内容

【2023新书】使用Python进行数据可视化：探索Matplotlib、Seaborn和Bokeh进行交互式可视化

【2023新书】使用Python进行数据可视化：探索Matplotlib、Seaborn和Bokeh进行交互式可视化

专知会员服务

72+阅读 · 2023年11月18日

【2023新书】Python数据科学手册:使用数据的基本工具，591页pdf

【2023新书】Python数据科学手册:使用数据的基本工具，591页pdf

专知会员服务

111+阅读 · 2023年2月28日

【干货书】数据可视化:实用介绍，293页pdf

【干货书】数据可视化:实用介绍，293页pdf

专知会员服务

57+阅读 · 2023年2月18日

【2023新书】用Python和JavaScript实现数据可视化:抓取、清理、探索和转换数据，569页pdf

【2023新书】用Python和JavaScript实现数据可视化:抓取、清理、探索和转换数据，569页pdf

专知会员服务

82+阅读 · 2023年2月8日

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

专知会员服务

62+阅读 · 2022年7月16日

【开放书】Python + Matplotlib可视化指南，249页pdf

【开放书】Python + Matplotlib可视化指南，249页pdf

专知会员服务

98+阅读 · 2021年11月17日

【开放书】数据可视化基础，《Fundamentals of Data Visualization》

专知会员服务

65+阅读 · 2021年6月13日

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

专知会员服务

48+阅读 · 2020年8月8日

【实用书】Python数据分析与可视化，390页pdf，分析数据以创建BI系统的可视化

【实用书】Python数据分析与可视化，390页pdf，分析数据以创建BI系统的可视化

专知会员服务

164+阅读 · 2020年4月13日

【实用书】图数据分析与可视化，538页pdf，发现关联数据中的商机

【实用书】图数据分析与可视化，538页pdf，发现关联数据中的商机

专知会员服务

117+阅读 · 2020年4月12日

吐血整理！140种Python标准库、第三方库和外部工具都有了

吐血整理！140种Python标准库、第三方库和外部工具都有了

炼数成金订阅号

16+阅读 · 2019年7月30日

【资源推荐】AI可解释性资源汇总

【资源推荐】AI可解释性资源汇总

专知

47+阅读 · 2019年4月24日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

大神自学后作《Python数据分析入门——从数据获取到可视化》

大神自学后作《Python数据分析入门——从数据获取到可视化》

数据猿

19+阅读 · 2018年5月29日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

推荐｜使用 OpenCV和Python基于深度学习实现实时视频目标检测!

推荐｜使用 OpenCV和Python基于深度学习实现实时视频目标检测!

全球人工智能

10+阅读 · 2017年12月19日

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

专知

29+阅读 · 2017年11月26日

教程 | 深度学习 + OpenCV，Python实现实时视频目标检测

教程 | 深度学习 + OpenCV，Python实现实时视频目标检测

机器之心

18+阅读 · 2017年9月21日

基于区分型码本的图像表示的研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

保持结构的交互式图像及视频编辑方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

云环境下结合视觉特征的图像视频集编码与传输

国家自然科学基金

1+阅读 · 2015年12月31日

面向智能穿戴设备的三维图形网格简化与渐进显示方法

国家自然科学基金

1+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

Aligned Multi-View Scripts for Universal Chart-to-Code Generation

Arxiv

0+阅读 · 4月27日

DataClaw: An Autonomous Data Agent with Instant Messaging Integration

Arxiv

0+阅读 · 4月27日

Explainable Iterative Data Visualisation Refinement via an LLM Agent

Arxiv

0+阅读 · 4月22日

ReVis: Towards Reusable Image-Based Visualizations with MLLMs

Arxiv

0+阅读 · 4月17日

MagicCopy: Bring my data along with me beyond boundaries of apps

Arxiv

0+阅读 · 4月8日

ProVega: A Grammar to Ease the Prototyping, Creation, and Reproducibility of Progressive Data Analysis and Visualization Solutions

Arxiv

0+阅读 · 4月2日

Containing the Reproducibility Gap: Automated Repository-Level Containerization for Scholarly Jupyter Notebooks

Arxiv

0+阅读 · 4月1日

Scaling Reproducibility: An AI-Assisted Workflow for Large-Scale Replication and Reanalysis

Arxiv

0+阅读 · 3月25日

PaperVoyager : Building Interactive Web with Visual Language Models

Arxiv

0+阅读 · 3月24日

iDaVIE v1.0: A virtual reality tool for interactive analysis of astronomical data cubes

iDaVIE v1.0: A virtual reality tool for interactive analysis of astronomical data cubes

Arxiv

0+阅读 · 3月16日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

7+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

6+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

8+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

【2023新书】使用Python进行数据可视化：探索Matplotlib、Seaborn和Bokeh进行交互式可视化

【2023新书】使用Python进行数据可视化：探索Matplotlib、Seaborn和Bokeh进行交互式可视化

专知会员服务

72+阅读 · 2023年11月18日

【2023新书】Python数据科学手册:使用数据的基本工具，591页pdf

【2023新书】Python数据科学手册:使用数据的基本工具，591页pdf

专知会员服务

111+阅读 · 2023年2月28日

【干货书】数据可视化:实用介绍，293页pdf

【干货书】数据可视化:实用介绍，293页pdf

专知会员服务

57+阅读 · 2023年2月18日

【2023新书】用Python和JavaScript实现数据可视化:抓取、清理、探索和转换数据，569页pdf

【2023新书】用Python和JavaScript实现数据可视化:抓取、清理、探索和转换数据，569页pdf

专知会员服务

82+阅读 · 2023年2月8日

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

【2022新书】使用Python进行高效生产的数据科学:模块化、内存配置文件和并行/GPU处理，395页pdf

专知会员服务

62+阅读 · 2022年7月16日

【开放书】Python + Matplotlib可视化指南，249页pdf

【开放书】Python + Matplotlib可视化指南，249页pdf

专知会员服务

98+阅读 · 2021年11月17日

【开放书】数据可视化基础，《Fundamentals of Data Visualization》

专知会员服务

65+阅读 · 2021年6月13日

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

专知会员服务

48+阅读 · 2020年8月8日

【实用书】Python数据分析与可视化，390页pdf，分析数据以创建BI系统的可视化

【实用书】Python数据分析与可视化，390页pdf，分析数据以创建BI系统的可视化

专知会员服务

164+阅读 · 2020年4月13日

【实用书】图数据分析与可视化，538页pdf，发现关联数据中的商机

【实用书】图数据分析与可视化，538页pdf，发现关联数据中的商机

专知会员服务

117+阅读 · 2020年4月12日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

吐血整理！140种Python标准库、第三方库和外部工具都有了

吐血整理！140种Python标准库、第三方库和外部工具都有了

炼数成金订阅号

16+阅读 · 2019年7月30日

【资源推荐】AI可解释性资源汇总

【资源推荐】AI可解释性资源汇总

专知

47+阅读 · 2019年4月24日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

大神自学后作《Python数据分析入门——从数据获取到可视化》

大神自学后作《Python数据分析入门——从数据获取到可视化》

数据猿

19+阅读 · 2018年5月29日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

推荐｜使用 OpenCV和Python基于深度学习实现实时视频目标检测!

推荐｜使用 OpenCV和Python基于深度学习实现实时视频目标检测!

全球人工智能

10+阅读 · 2017年12月19日

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

专知

29+阅读 · 2017年11月26日

教程 | 深度学习 + OpenCV，Python实现实时视频目标检测

教程 | 深度学习 + OpenCV，Python实现实时视频目标检测

机器之心

18+阅读 · 2017年9月21日

相关论文

Aligned Multi-View Scripts for Universal Chart-to-Code Generation

Arxiv

0+阅读 · 4月27日

DataClaw: An Autonomous Data Agent with Instant Messaging Integration

Arxiv

0+阅读 · 4月27日

Explainable Iterative Data Visualisation Refinement via an LLM Agent

Arxiv

0+阅读 · 4月22日

ReVis: Towards Reusable Image-Based Visualizations with MLLMs

Arxiv

0+阅读 · 4月17日

MagicCopy: Bring my data along with me beyond boundaries of apps

Arxiv

0+阅读 · 4月8日

ProVega: A Grammar to Ease the Prototyping, Creation, and Reproducibility of Progressive Data Analysis and Visualization Solutions

Arxiv

0+阅读 · 4月2日

Containing the Reproducibility Gap: Automated Repository-Level Containerization for Scholarly Jupyter Notebooks

Arxiv

0+阅读 · 4月1日

Scaling Reproducibility: An AI-Assisted Workflow for Large-Scale Replication and Reanalysis

Arxiv

0+阅读 · 3月25日

PaperVoyager : Building Interactive Web with Visual Language Models

Arxiv

0+阅读 · 3月24日

iDaVIE v1.0: A virtual reality tool for interactive analysis of astronomical data cubes

iDaVIE v1.0: A virtual reality tool for interactive analysis of astronomical data cubes

Arxiv

0+阅读 · 3月16日

相关基金

基于区分型码本的图像表示的研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

保持结构的交互式图像及视频编辑方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

云环境下结合视觉特征的图像视频集编码与传输

国家自然科学基金

1+阅读 · 2015年12月31日

面向智能穿戴设备的三维图形网格简化与渐进显示方法

国家自然科学基金

1+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员