Scalable Vector Graphics (SVG) represent visual content as structured, editable code. Each element (path, shape, or text node) can be individually inspected, transformed, or removed. This structural editability is a main motivation for SVG generation, yet prevailing evaluation protocols primarily reduce the output to a single similarity score against a reference image or input texts, measuring how faithfully the result reproduces an image or follows the instructions, but not how well it preserves the structural properties that make SVG valuable. In particular, existing metrics cannot determine which generated elements contribute positively to overall visual quality, how visual concepts map to specific parts of the code, or whether the generated output supports meaningful downstream editing. We introduce element-level leave-one-out (LOO) analysis, inspired by the classic jackknife estimator. The procedure renders the SVG with and without each element, measures the resulting visual change, and derives a suite of structural quality metrics. Despite its simplicity, the jackknife's capacity to decompose an aggregate statistic into per-sample contributions translates directly to this setting. From a single mechanism, we obtain: (1) quality scores per element through LOO scoring that enable zero-shot artifact detection; (2) concept-element attribution that maps each element to the visual concept it serves; and (3) four structural metrics, purity, coverage, compactness, and locality, that quantify SVG modularity from complementary perspectives. We validate these metrics on over 19,000 edits (5 types) across 5 generation systems and 3 complexity tiers.


翻译:可缩放矢量图形(SVG)以结构化、可编辑的代码形式表示视觉内容。每个元素(路径、形状或文本节点)均可单独检查、变换或删除。这种结构化可编辑性是生成 SVG 的主要动机,然而现有的评价协议主要将输出简化为针对参考图像或输入文本的单一相似度得分,衡量结果再现图像或遵循指令的忠实程度,但并未评估其保留使 SVG 具有价值的结构化属性的好坏程度。特别是,现有指标无法判断哪些生成元素对整体视觉质量有积极贡献、视觉概念如何映射到代码的特定部分,或者生成的输出是否支持有意义的后续编辑。受经典刀切估计量的启发,我们引入了元素级的留一(LOO)分析。该过程分别在有和无每个元素的情况下渲染 SVG,测量由此产生的视觉变化,并推导出一套结构化质量指标。尽管简单,但刀切法将聚合统计量分解为逐样本贡献的能力直接适用于这一场景。通过单一机制,我们获得:(1)通过 LOO 评分得到的每个元素的质量得分,从而实现零样本伪影检测;(2)概念-元素归因,将每个元素映射到其服务的视觉概念;(3)四个结构化指标——纯度、覆盖率、紧凑性和局部性——从互补角度量化 SVG 的模块化程度。我们在 5 个生成系统和 3 个复杂度级别上,对超过 19,000 个编辑(5 种类型)验证了这些指标。

0
下载
关闭预览

相关内容

3D形状生成:综述
专知会员服务
18+阅读 · 2025年7月7日
基于文本的3D视觉定位综述:要素、最新进展与未来方向
结构保持图transformer综述
专知会员服务
42+阅读 · 2024年2月19日
【博士论文】结构化数据自动可视化关键技术研究
专知会员服务
47+阅读 · 2023年12月6日
场景图生成:一个全面综述
专知会员服务
67+阅读 · 2022年1月4日
一行命令搞定图像质量评价
计算机视觉life
12+阅读 · 2019年12月31日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
文本识别 OCR 浅析:特征篇
开源中国
16+阅读 · 2018年1月6日
论文报告 | Graph-based Neural Multi-Document Summarization
科技创新与创业
15+阅读 · 2017年12月15日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关主题
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
2+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
4+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
3+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员