Traditional statistical graphics are precise but often lack the visual appeal, memorability, and engagement of pictorial charts. We present a generative framework for the automated synthesis of pictorial charts that bridges the gap between semantic expression and structural faithfulness. Rather than treating charts merely as images to be stylized, we frame the problem as a dual-conditioned generation task guided by two parallel external control signals: a text prompt capturing the semantic context of the editing intent, and a context image providing the abstract statistical chart's global structure. To reinforce these controls within a Multi-Modal Diffusion Transformer, we introduce two complementary feature-level mechanisms: structural alignment to anchor spatial layouts to the input chart, and semantic alignment to transfer expressive textures from reference images. Generalizing across major visual channels (i.e., length, area, angle, and position) and diverse semantic domains, our method produces pictorial charts that are both artistically compelling and structurally consistent. Extensive quantitative evaluations and perceptual user studies demonstrate that our framework outperforms traditional controllable generation and image editing baselines, providing a foundation for high-fidelity, data-driven generative modeling in expressive visual storytelling. Project page: https://ssalign.github.io/.


翻译:传统统计图表精确性强,但在视觉吸引力、记忆点和用户参与度上往往不及可视化图表。我们提出一种自动化合成可视化图表的生成框架,旨在弥合语义表达与结构保真度之间的鸿沟。不同于将图表简单地视为需要风格化的图像,我们将此问题界定为一个双条件生成任务——受两组并行外部控制信号引导:一是捕捉编辑意图语义上下文的文本提示,二是提供抽象统计图表全局结构的语境图像。为在多模态扩散Transformer中强化这些控制信号,我们引入两种互补的特征级机制:结构对齐用于锚定输入图表的空间布局,语义对齐用于从参考图像迁移表现性纹理。该方法可泛化至长度、面积、角度和位置等主要视觉通道,并覆盖多样化语义领域,生成的可视化图表兼具艺术感染力与结构一致性。通过大量定量评估与感知用户研究,我们的框架在传统可控生成与图像编辑基线方法中表现更优,为高保真度、数据驱动的生成式建模在表现性视觉叙事中的应用奠定了基础。项目页面:https://ssalign.github.io/。

0
下载
关闭预览

相关内容

高阶网络的表示:基于图的框架综述
专知会员服务
16+阅读 · 5月14日
图表大数据解析方法综述
专知会员服务
19+阅读 · 2025年1月31日
《图简化(Graph Reduction)》最新综述
专知会员服务
31+阅读 · 2024年2月10日
【博士论文】结构化数据自动可视化关键技术研究
专知会员服务
47+阅读 · 2023年12月6日
最新《图嵌入组合优化》综述论文,40页pdf
图嵌入(Graph embedding)综述
人工智能前沿讲习班
449+阅读 · 2019年4月30日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
【学界】 李飞飞学生最新论文:利用场景图生成图像
GAN生成式对抗网络
15+阅读 · 2018年4月9日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 今天14:45
定向能反无人机系统最新发展动态
专知会员服务
5+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 今天13:33
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员