Identifying Models Behind Text-to-Image Leaderboards - 专知论文

会员服务 ·

0

匿名化 · 识别 · 在线 · 输出 · 嵌入 ·

Identifying Models Behind Text-to-Image Leaderboards

翻译：识别文本到图像排行榜背后的模型

Ali Naseh,Yuefeng Peng,Anshuman Suri,Harsh Chaudhari,Alina Oprea,Amir Houmansadr

Text-to-image (T2I) models are increasingly popular, producing a large share of AI-generated images online. To compare model quality, voting-based leaderboards have become the standard, relying on anonymized model outputs for fairness. In this work, we show that such anonymity can be easily broken. We find that generations from each T2I model form distinctive clusters in the image embedding space, enabling accurate deanonymization without prompt control or training data. Using 22 models and 280 prompts (150K images), our centroid-based method achieves high accuracy and reveals systematic model-specific signatures. We further introduce a prompt-level distinguishability metric and conduct large-scale analyses showing how certain prompts can lead to near-perfect distinguishability. Our findings expose fundamental security flaws in T2I leaderboards and motivate stronger anonymization defenses.

翻译：文本到图像（T2I）模型日益普及，在线生成的人工智能图像中很大一部分由其产生。为比较模型质量，基于投票的排行榜已成为标准，其依赖于匿名化的模型输出以确保公平性。本研究中，我们证明此类匿名性可被轻易破解。我们发现每个T2I模型的生成结果在图像嵌入空间中形成独特的聚类，从而无需提示控制或训练数据即可实现精准的去匿名化。通过使用22个模型和280个提示（共15万张图像），我们基于质心的方法实现了高准确率，并揭示了系统性的模型特定特征。我们进一步提出了提示级别的可区分性度量，并进行了大规模分析，表明某些提示可导致近乎完美的可区分性。我们的研究结果揭示了T2I排行榜中根本性的安全缺陷，并推动了更强匿名化防御机制的发展。

0

相关内容

匿名化

文本生成与编辑图像：综述

文本生成与编辑图像：综述

专知会员服务

11+阅读 · 2025年5月8日

【WWW2025】ImageScope：通过大型多模态模型集体推理统一语言引导的图像检索

【WWW2025】ImageScope：通过大型多模态模型集体推理统一语言引导的图像检索

专知会员服务

12+阅读 · 2025年4月22日

【CVPR2025】先获取后适配：挖掘文本‑图像生成模型在图像复原中的潜力

【CVPR2025】先获取后适配：挖掘文本‑图像生成模型在图像复原中的潜力

专知会员服务

11+阅读 · 2025年4月22日

IMAGINE-E：最先进文本到图像模型的图像生成智能评估

IMAGINE-E：最先进文本到图像模型的图像生成智能评估

专知会员服务

13+阅读 · 2025年2月3日

文本到图像合成：十年回顾

文本到图像合成：十年回顾

专知会员服务

31+阅读 · 2024年11月26日

《可信文本到图像扩散模型》最新综述

《可信文本到图像扩散模型》最新综述

专知会员服务

27+阅读 · 2024年9月30日

复旦最新《基于文本到图像扩散模型的多模态引导图像编辑》综述

复旦最新《基于文本到图像扩散模型的多模态引导图像编辑》综述

专知会员服务

16+阅读 · 2024年6月21日

【CVPR2024】用于文本到图像生成的判别性探测和调整

【CVPR2024】用于文本到图像生成的判别性探测和调整

专知会员服务

15+阅读 · 2024年3月11日

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

专知会员服务

69+阅读 · 2024年3月9日

【博士论文】面向文本生成的深度序列模型研究

专知会员服务

56+阅读 · 2020年12月20日

使用 Bert 预训练模型文本分类（内附源码）

使用 Bert 预训练模型文本分类（内附源码）

数据库开发

102+阅读 · 2019年3月12日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

Image Captioning 36页最新综述， 161篇参考文献

Image Captioning 36页最新综述， 161篇参考文献

专知

90+阅读 · 2018年10月23日

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

深度学习与NLP

25+阅读 · 2018年7月18日

图像和文本的融合表示学习——Text2Image和Image2Text

图像和文本的融合表示学习——Text2Image和Image2Text

专知

125+阅读 · 2018年6月11日

实践 | 如何使用深度学习为照片自动生成文本描述？

实践 | 如何使用深度学习为照片自动生成文本描述？

七月在线实验室

10+阅读 · 2018年5月21日

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

专知

11+阅读 · 2018年3月20日

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

专知

10+阅读 · 2018年3月2日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

深度学习在文本分类中的应用

深度学习在文本分类中的应用

AI研习社

13+阅读 · 2018年1月7日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于区分型码本的图像表示的研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

PromptGuard: Soft Prompt-Guided Unsafe Content Moderation for Text-to-Image Models

Arxiv

0+阅读 · 2月18日

Consistent text-to-image generation via scene de-contextualization

Arxiv

0+阅读 · 2月15日

Anonymization Prompt Learning for Facial Privacy-Preserving Text-to-Image Generation

Arxiv

0+阅读 · 2月6日

Show, Don't Tell: Morphing Latent Reasoning into Image Generation

Arxiv

0+阅读 · 2月2日

DOS: Directional Object Separation in Text Embeddings for Multi-Object Image Generation

Arxiv

0+阅读 · 2月2日

Everything in Its Place: Benchmarking Spatial Intelligence of Text-to-Image Models

Arxiv

0+阅读 · 1月28日

An Exploration of Default Images in Text-to-Image Generation

Arxiv

0+阅读 · 1月25日

Unified Text-Image Generation with Weakness-Targeted Post-Training

Arxiv

0+阅读 · 1月21日

ESPLoRA: Enhanced Spatial Precision with Low-Rank Adaption in Text-to-Image Diffusion Models for High-Definition Synthesis

Arxiv

0+阅读 · 1月20日

Beyond the Safety Tax: Mitigating Unsafe Text-to-Image Generation via External Safety Rectification

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

最新内容

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

1+阅读 · 31分钟前

多智能体协作机制

多智能体协作机制

专知会员服务

0+阅读 · 35分钟前

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

4+阅读 · 今天4:39

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

14+阅读 · 今天2:52

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

5+阅读 · 今天2:48

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

8+阅读 · 今天2:43

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

6+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

7+阅读 · 4月24日

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

8+阅读 · 4月24日

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

6+阅读 · 4月24日

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

6+阅读 · 4月24日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

9+阅读 · 4月24日

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

13+阅读 · 4月24日

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

9+阅读 · 4月24日

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

4+阅读 · 4月24日

相关VIP内容

文本生成与编辑图像：综述

文本生成与编辑图像：综述

专知会员服务

11+阅读 · 2025年5月8日

【WWW2025】ImageScope：通过大型多模态模型集体推理统一语言引导的图像检索

【WWW2025】ImageScope：通过大型多模态模型集体推理统一语言引导的图像检索

专知会员服务

12+阅读 · 2025年4月22日

【CVPR2025】先获取后适配：挖掘文本‑图像生成模型在图像复原中的潜力

【CVPR2025】先获取后适配：挖掘文本‑图像生成模型在图像复原中的潜力

专知会员服务

11+阅读 · 2025年4月22日

IMAGINE-E：最先进文本到图像模型的图像生成智能评估

IMAGINE-E：最先进文本到图像模型的图像生成智能评估

专知会员服务

13+阅读 · 2025年2月3日

文本到图像合成：十年回顾

文本到图像合成：十年回顾

专知会员服务

31+阅读 · 2024年11月26日

《可信文本到图像扩散模型》最新综述

《可信文本到图像扩散模型》最新综述

专知会员服务

27+阅读 · 2024年9月30日

复旦最新《基于文本到图像扩散模型的多模态引导图像编辑》综述

复旦最新《基于文本到图像扩散模型的多模态引导图像编辑》综述

专知会员服务

16+阅读 · 2024年6月21日

【CVPR2024】用于文本到图像生成的判别性探测和调整

【CVPR2024】用于文本到图像生成的判别性探测和调整

专知会员服务

15+阅读 · 2024年3月11日

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

专知会员服务

69+阅读 · 2024年3月9日

【博士论文】面向文本生成的深度序列模型研究

专知会员服务

56+阅读 · 2020年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

多智能体协作机制

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

2025年大语言模型进展报告

非对称优势：美海军开发低成本反无人机技术

相关资讯

使用 Bert 预训练模型文本分类（内附源码）

使用 Bert 预训练模型文本分类（内附源码）

数据库开发

102+阅读 · 2019年3月12日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

Image Captioning 36页最新综述， 161篇参考文献

Image Captioning 36页最新综述， 161篇参考文献

专知

90+阅读 · 2018年10月23日

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

深度学习与NLP

25+阅读 · 2018年7月18日

图像和文本的融合表示学习——Text2Image和Image2Text

图像和文本的融合表示学习——Text2Image和Image2Text

专知

125+阅读 · 2018年6月11日

实践 | 如何使用深度学习为照片自动生成文本描述？

实践 | 如何使用深度学习为照片自动生成文本描述？

七月在线实验室

10+阅读 · 2018年5月21日

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

专知

11+阅读 · 2018年3月20日

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

专知

10+阅读 · 2018年3月2日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

深度学习在文本分类中的应用

深度学习在文本分类中的应用

AI研习社

13+阅读 · 2018年1月7日

相关论文

PromptGuard: Soft Prompt-Guided Unsafe Content Moderation for Text-to-Image Models

Arxiv

0+阅读 · 2月18日

Consistent text-to-image generation via scene de-contextualization

Arxiv

0+阅读 · 2月15日

Anonymization Prompt Learning for Facial Privacy-Preserving Text-to-Image Generation

Arxiv

0+阅读 · 2月6日

Show, Don't Tell: Morphing Latent Reasoning into Image Generation

Arxiv

0+阅读 · 2月2日

DOS: Directional Object Separation in Text Embeddings for Multi-Object Image Generation

Arxiv

0+阅读 · 2月2日

Everything in Its Place: Benchmarking Spatial Intelligence of Text-to-Image Models

Arxiv

0+阅读 · 1月28日

An Exploration of Default Images in Text-to-Image Generation

Arxiv

0+阅读 · 1月25日

Unified Text-Image Generation with Weakness-Targeted Post-Training

Arxiv

0+阅读 · 1月21日

ESPLoRA: Enhanced Spatial Precision with Low-Rank Adaption in Text-to-Image Diffusion Models for High-Definition Synthesis

Arxiv

0+阅读 · 1月20日

Beyond the Safety Tax: Mitigating Unsafe Text-to-Image Generation via External Safety Rectification

Arxiv

0+阅读 · 1月19日

相关基金

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于区分型码本的图像表示的研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员