Story visualization aims to generate coherent image sequences that faithfully represent a narrative and match given character references. Despite progress in generative models, existing benchmarks remain narrow in scope, often limited to short prompts, lacking character references, or single-image cases, failing to reflect real-world narrative complexity and obscuring true model performance.We introduce ViStoryBench, a comprehensive benchmark designed to evaluate story visualization models across varied narrative structures, visual styles, and character settings. It features richly annotated multi-shot scripts derived from curated stories spanning literature, film, and folklore. Large language models assist in story summarization and script generation, with all outputs verified by humans for coherence and fidelity. Character references are carefully curated to maintain consistency across different artistic styles. ViStoryBench proposes a suite of multi-dimensional automated metrics to evaluate character consistency, style similarity, prompt alignment, aesthetic quality, and artifacts like copy-paste behavior. These metrics are validated through human studies and used to assess a broad range of open-source and commercial models, enabling systematic analysis and encouraging advances in visual storytelling.


翻译:故事可视化的目标是生成连贯的图像序列,使其能够忠实呈现叙事内容并与给定的角色参考保持一致。尽管生成模型取得了进展,但现有基准测试的范围依然狭窄,通常局限于短提示、缺乏角色参考或仅涉及单张图像案例,未能反映现实叙事复杂性,并掩盖了模型的真实性能。我们引入ViStoryBench,这是一个综合基准测试,旨在评估故事可视化模型在不同叙事结构、视觉风格和角色设定下的表现。该基准测试包含从文学、电影和民间传说中精选出的、带有丰富注释的多镜头脚本。大语言模型辅助故事摘要与脚本生成,所有输出经人工验证以确保连贯性与保真度。角色参考经过精心策划,以在不同艺术风格中保持一致性。ViStoryBench提出了一套多维自动化指标,用于评估角色一致性、风格相似性、提示对齐度、美学质量以及伪影(如复制粘贴行为)。这些指标通过人工研究验证,并用于评估广泛的开源与商业模型,从而支持系统性分析并推动视觉故事讲述领域的发展。

0
下载
关闭预览

相关内容

VBVR:超大规模视频推理评测与数据集套件
专知会员服务
7+阅读 · 3月2日
《可控视频生成:综述》
专知会员服务
17+阅读 · 2025年7月24日
专知会员服务
129+阅读 · 2021年6月12日
【Facebook】人工智能基准(Benchmarking)测试再思考,55页ppt
专知会员服务
31+阅读 · 2020年12月20日
事件知识图谱构建技术与应用综述
专知
25+阅读 · 2020年8月6日
事件知识图谱构建研究进展与趋势
THU数据派
99+阅读 · 2019年12月11日
Image Captioning 36页最新综述, 161篇参考文献
专知
90+阅读 · 2018年10月23日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
8+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
10+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员