VerLM：使用自然语言解释人脸验证 (VerLM: Explaining Face Verification Using Natural Language) - 专知论文

会员服务 ·

0

人脸 · 验证系统 · 系统 · 语言模型 · 视觉语言模型 ·

VerLM: Explaining Face Verification Using Natural Language

翻译：VerLM：使用自然语言解释人脸验证

Syed Abdul Hannan,Hazim Bukhari,Thomas Cantalapiedra,Eman Ansar,Massa Baali,Rita Singh,Bhiksha Raj

Face verification systems have seen substantial advancements; however, they often lack transparency in their decision-making processes. In this paper, we introduce an innovative Vision-Language Model (VLM) for Face Verification, which not only accurately determines if two face images depict the same individual but also explicitly explains the rationale behind its decisions. Our model is uniquely trained using two complementary explanation styles: (1) concise explanations that summarize the key factors influencing its decision, and (2) comprehensive explanations detailing the specific differences observed between the images. We adapt and enhance a state-of-the-art modeling approach originally designed for audio-based differentiation to suit visual inputs effectively. This cross-modal transfer significantly improves our model's accuracy and interpretability. The proposed VLM integrates sophisticated feature extraction techniques with advanced reasoning capabilities, enabling clear articulation of its verification process. Our approach demonstrates superior performance, surpassing baseline methods and existing models. These findings highlight the immense potential of vision language models in face verification set up, contributing to more transparent, reliable, and explainable face verification systems.

翻译：人脸验证系统已取得显著进展，然而其决策过程往往缺乏透明度。本文提出一种创新的视觉语言模型（VLM），用于人脸验证任务。该模型不仅能准确判断两幅人脸图像是否属于同一人，还能明确解释其决策依据。我们采用两种互补的解释风格对模型进行独特训练：（1）总结影响决策关键因素的简明解释；（2）详细描述图像间具体差异的全面解释。我们改进并适配了一种最初为音频差异识别设计的最先进建模方法，使其能有效处理视觉输入。这种跨模态迁移显著提升了模型的准确性和可解释性。所提出的VLM融合了先进的特征提取技术与高级推理能力，能够清晰阐述其验证过程。实验表明，该方法性能优异，超越了基线方法与现有模型。这些发现凸显了视觉语言模型在人脸验证场景中的巨大潜力，有助于构建更透明、可靠且可解释的人脸验证系统。

0

相关内容

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

专知会员服务

15+阅读 · 2025年8月5日

《Med3DVLM：面向三维医学图像分析的高效视觉-语言模型》

《Med3DVLM：面向三维医学图像分析的高效视觉-语言模型》

专知会员服务

9+阅读 · 2025年3月27日

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

专知会员服务

16+阅读 · 2022年4月10日

什么是自然-XAI？ICML2021这份《可解释人工智能-自然语言解释》教程

什么是自然-XAI？ICML2021这份《可解释人工智能-自然语言解释》教程

专知会员服务

41+阅读 · 2021年7月25日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

人脸亲子关系验证研究综述

专知会员服务

21+阅读 · 2021年5月20日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

专知会员服务

26+阅读 · 2020年7月24日

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

专知会员服务

24+阅读 · 2020年3月20日

人脸相关文献代码集锦：人脸检测、人脸识别、人脸生成等

人脸相关文献代码集锦：人脸检测、人脸识别、人脸生成等

专知

15+阅读 · 2019年5月20日

人脸检测库：libfacedetection

人脸检测库：libfacedetection

Python程序员

15+阅读 · 2019年3月22日

人脸识别技术全面总结：从传统方法到深度学习

人脸识别技术全面总结：从传统方法到深度学习

算法与数学之美

12+阅读 · 2019年2月27日

清华大学发布：人脸识别最全知识图谱

清华大学发布：人脸识别最全知识图谱

全球创新论坛

10+阅读 · 2018年11月21日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

CVPR 2018 | 腾讯AI Lab提出新型损失函数LMCL：可显著增强人脸识别模型的判别能力

CVPR 2018 | 腾讯AI Lab提出新型损失函数LMCL：可显著增强人脸识别模型的判别能力

机器之心

11+阅读 · 2018年3月26日

【干货】通过OpenFace来理解人脸识别

【干货】通过OpenFace来理解人脸识别

专知

56+阅读 · 2018年1月23日

人脸表情分类与识别：人脸检测+情绪分类

人脸表情分类与识别：人脸检测+情绪分类

北京思腾合力科技有限公司

27+阅读 · 2017年12月18日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

人脸检测与识别总结

人脸检测与识别总结

计算机视觉战队

21+阅读 · 2017年11月29日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于结构特征的人脸识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于毛孔尺度面部特征的高效人脸识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向公共安全的不可控条件下异质人脸图像变换和识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

一种非均匀光照和局部遮挡环境下维吾尔族人脸识别算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

人脸皮肤软组织跨尺度变形测量与表情形成机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

PVLM: Parsing-Aware Vision Language Model with Dynamic Contrastive Learning for Zero-Shot Deepfake Attribution

Arxiv

0+阅读 · 1月25日

Vision-Language Models Align with Human Neural Representations in Concept Processing

Arxiv

0+阅读 · 1月22日

AutoDriDM: An Explainable Benchmark for Decision-Making of Vision-Language Models in Autonomous Driving

Arxiv

0+阅读 · 1月21日

IIR-VLM: In-Context Instance-level Recognition for Large Vision-Language Models

Arxiv

0+阅读 · 1月20日

Analyzing VLM-Based Approaches for Anomaly Classification and Segmentation

Arxiv

0+阅读 · 1月19日

Towards Safer Mobile Agents: Scalable Generation and Evaluation of Diverse Scenarios for VLMs

Arxiv

0+阅读 · 1月13日

Two-step Authentication: Multi-biometric System Using Voice and Facial Recognition

Arxiv

0+阅读 · 1月9日

From Understanding to Engagement: Personalized pharmacy Video Clips via Vision Language Models (VLMs)

Arxiv

0+阅读 · 1月8日

Text2VLM: Adapting Text-Only Datasets to Evaluate Alignment Training in Visual Language Models

Arxiv

0+阅读 · 1月5日

VisualActBench: Can VLMs See and Act like a Human?

Arxiv

0+阅读 · 1月4日

VIP会员

文章信息

相关主题

视觉语言模型

相关VIP内容

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

专知会员服务

15+阅读 · 2025年8月5日

《Med3DVLM：面向三维医学图像分析的高效视觉-语言模型》

《Med3DVLM：面向三维医学图像分析的高效视觉-语言模型》

专知会员服务

9+阅读 · 2025年3月27日

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

专知会员服务

16+阅读 · 2022年4月10日

什么是自然-XAI？ICML2021这份《可解释人工智能-自然语言解释》教程

什么是自然-XAI？ICML2021这份《可解释人工智能-自然语言解释》教程

专知会员服务

41+阅读 · 2021年7月25日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

人脸亲子关系验证研究综述

专知会员服务

21+阅读 · 2021年5月20日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

专知会员服务

26+阅读 · 2020年7月24日

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

专知会员服务

24+阅读 · 2020年3月20日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

人脸相关文献代码集锦：人脸检测、人脸识别、人脸生成等

人脸相关文献代码集锦：人脸检测、人脸识别、人脸生成等

专知

15+阅读 · 2019年5月20日

人脸检测库：libfacedetection

人脸检测库：libfacedetection

Python程序员

15+阅读 · 2019年3月22日

人脸识别技术全面总结：从传统方法到深度学习

人脸识别技术全面总结：从传统方法到深度学习

算法与数学之美

12+阅读 · 2019年2月27日

清华大学发布：人脸识别最全知识图谱

清华大学发布：人脸识别最全知识图谱

全球创新论坛

10+阅读 · 2018年11月21日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

CVPR 2018 | 腾讯AI Lab提出新型损失函数LMCL：可显著增强人脸识别模型的判别能力

CVPR 2018 | 腾讯AI Lab提出新型损失函数LMCL：可显著增强人脸识别模型的判别能力

机器之心

11+阅读 · 2018年3月26日

【干货】通过OpenFace来理解人脸识别

【干货】通过OpenFace来理解人脸识别

专知

56+阅读 · 2018年1月23日

人脸表情分类与识别：人脸检测+情绪分类

人脸表情分类与识别：人脸检测+情绪分类

北京思腾合力科技有限公司

27+阅读 · 2017年12月18日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

人脸检测与识别总结

人脸检测与识别总结

计算机视觉战队

21+阅读 · 2017年11月29日

相关论文

PVLM: Parsing-Aware Vision Language Model with Dynamic Contrastive Learning for Zero-Shot Deepfake Attribution

Arxiv

0+阅读 · 1月25日

Vision-Language Models Align with Human Neural Representations in Concept Processing

Arxiv

0+阅读 · 1月22日

AutoDriDM: An Explainable Benchmark for Decision-Making of Vision-Language Models in Autonomous Driving

Arxiv

0+阅读 · 1月21日

IIR-VLM: In-Context Instance-level Recognition for Large Vision-Language Models

Arxiv

0+阅读 · 1月20日

Analyzing VLM-Based Approaches for Anomaly Classification and Segmentation

Arxiv

0+阅读 · 1月19日

Towards Safer Mobile Agents: Scalable Generation and Evaluation of Diverse Scenarios for VLMs

Arxiv

0+阅读 · 1月13日

Two-step Authentication: Multi-biometric System Using Voice and Facial Recognition

Arxiv

0+阅读 · 1月9日

From Understanding to Engagement: Personalized pharmacy Video Clips via Vision Language Models (VLMs)

Arxiv

0+阅读 · 1月8日

Text2VLM: Adapting Text-Only Datasets to Evaluate Alignment Training in Visual Language Models

Arxiv

0+阅读 · 1月5日

VisualActBench: Can VLMs See and Act like a Human?

Arxiv

0+阅读 · 1月4日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于结构特征的人脸识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于毛孔尺度面部特征的高效人脸识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向公共安全的不可控条件下异质人脸图像变换和识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

一种非均匀光照和局部遮挡环境下维吾尔族人脸识别算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

人脸皮肤软组织跨尺度变形测量与表情形成机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员