Discrete image tokenizers encode visual inputs as sequences of tokens from a finite vocabulary and are gaining popularity in multimodal systems, including encoder-only, encoder-decoder, and decoder-only models. However, unlike CLIP encoders, their vulnerability to adversarial attacks has not been explored. Ours being the first work studying this topic, we first formulate attacks that aim to perturb the features extracted by discrete tokenizers, and thus change the extracted tokens. These attacks are computationally efficient, application-agnostic, and effective across classification, multimodal retrieval, and captioning tasks. Second, to defend against this vulnerability, inspired by recent work on robust CLIP encoders, we fine-tune popular tokenizers with unsupervised adversarial training, keeping all other components frozen. While unsupervised and task-agnostic, our approach significantly improves robustness to both unsupervised and end-to-end supervised attacks and generalizes well to unseen tasks and data. Unlike supervised adversarial training, our approach can leverage unlabeled images, making it more versatile. Overall, our work highlights the critical role of tokenizer robustness in downstream tasks and presents an important step in the development of safe multimodal foundation models.


翻译:离散图像分词器将视觉输入编码为有限词汇表中的标记序列,在包括仅编码器、编码器-解码器及仅解码器模型在内的多模态系统中日益普及。然而,与CLIP编码器不同,其面对对抗攻击的脆弱性尚未得到充分探索。作为该领域的首项研究工作,我们首先构建了旨在扰动离散分词器所提取特征、从而改变输出标记的攻击方法。这些攻击具有计算高效性、任务无关性,并在分类、多模态检索及描述生成任务中均表现出显著有效性。其次,为防御此类脆弱性,受鲁棒CLIP编码器相关研究的启发,我们采用无监督对抗训练对主流分词器进行微调,同时冻结所有其他组件。尽管采用无监督且任务无关的训练方式,本方法能显著提升模型对无监督攻击与端到端有监督攻击的鲁棒性,并在未见任务与数据上展现出良好的泛化能力。与有监督对抗训练不同,本方法可利用未标注图像进行训练,因而具备更强的适用性。总体而言,本研究揭示了分词器鲁棒性在下游任务中的关键作用,为开发安全的多模态基础模型迈出了重要一步。

0
下载
关闭预览

相关内容

将一个汉字序列切分成一个一个单独的词
面向图像分类的对抗鲁棒性评估综述
专知会员服务
59+阅读 · 2022年10月15日
知识图谱表示学习的对抗鲁棒性
专知会员服务
40+阅读 · 2022年10月7日
专知会员服务
32+阅读 · 2021年9月5日
专知会员服务
65+阅读 · 2020年9月10日
SemanticAdv:基于语义属性的对抗样本生成方法
机器之心
14+阅读 · 2019年7月12日
DL | 语义分割综述
机器学习算法与Python学习
58+阅读 · 2019年3月13日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
《图世界模型:概念、分类体系与未来方向》
专知会员服务
0+阅读 · 今天14:38
Palantir AIP平台:连接智能体与决策
专知会员服务
7+阅读 · 今天1:22
《美海军软件测试战略》90页slides
专知会员服务
7+阅读 · 今天1:00
面向具身智能与机器人仿真的三维生成:综述
专知会员服务
8+阅读 · 4月30日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员