Two-step Authentication: Multi-biometric System Using Voice and Facial Recognition - 专知论文

会员服务 ·

0

识别 · 系统 · 人脸 · 人脸识别 · 面部识别 ·

Two-step Authentication: Multi-biometric System Using Voice and Facial Recognition

翻译：两步认证：基于语音与面部识别的多生物特征系统

Kuan Wei Chen,Ting Yi Lin,Wen Ren Yang,Aryan Kesarwani,Riya Singh

from arxiv, Accepted manuscript (author version, v2). The published version appears in IET Conference Proceedings; see DOI: 10.1049/icp.2024.4141. Code: https://github.com/NCUE-EE-AIAL/Two-step-Authentication-Multi-biometric-System

We present a cost-effective two-step authentication system that integrates face identification and speaker verification using only a camera and microphone available on common devices. The pipeline first performs face recognition to identify a candidate user from a small enrolled group, then performs voice recognition only against the matched identity to reduce computation and improve robustness. For face recognition, a pruned VGG-16 based classifier is trained on an augmented dataset of 924 images from five subjects, with faces localized by MTCNN; it achieves 95.1% accuracy. For voice recognition, a CNN speaker-verification model trained on LibriSpeech (train-other-360) attains 98.9% accuracy and 3.456% EER on test-clean. Source code and trained models are available at https://github.com/NCUE-EE-AIAL/Two-step-Authentication-Multi-biometric-System.

翻译：本文提出一种经济高效的两步认证系统，该系统仅利用常见设备自带的摄像头与麦克风，集成了人脸识别与说话人验证功能。处理流程首先通过人脸识别从已注册的小规模用户组中确定候选用户身份，随后仅针对匹配身份进行语音识别，从而降低计算开销并提升系统鲁棒性。人脸识别模块采用基于剪枝VGG-16架构的分类器，在包含五名受试者共924张图像的增强数据集上进行训练（人脸检测采用MTCNN），最终达到95.1%的准确率。语音识别模块采用基于LibriSpeech（train-other-360子集）训练的CNN说话人验证模型，在test-clean测试集上取得98.9%准确率与3.456%等错误率。源代码与训练模型已发布于https://github.com/NCUE-EE-AIAL/Two-step-Authentication-Multi-biometric-System。

0

相关内容

最新！《信息技术生物特征识别人脸识别系统测试方法》国家标准意见稿发布

最新！《信息技术生物特征识别人脸识别系统测试方法》国家标准意见稿发布

专知会员服务

33+阅读 · 2022年4月11日

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

专知会员服务

16+阅读 · 2022年4月10日

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

专知会员服务

21+阅读 · 2022年3月22日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

人脸亲子关系验证研究综述

专知会员服务

21+阅读 · 2021年5月20日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

视频人脸识别进展综述

视频人脸识别进展综述

专知会员服务

56+阅读 · 2021年3月12日

【ACL2020-亚马逊】Transformers多分辨率和多模态语音识别，Multiresolution and Multimodal Speech Recognition with Transformers

【ACL2020-亚马逊】Transformers多分辨率和多模态语音识别，Multiresolution and Multimodal Speech Recognition with Transformers

专知会员服务

15+阅读 · 2020年5月5日

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

专知会员服务

24+阅读 · 2020年3月20日

计算机视觉方向简介 | 人脸表情识别

计算机视觉方向简介 | 人脸表情识别

计算机视觉life

36+阅读 · 2019年5月15日

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

专知

14+阅读 · 2019年4月17日

人脸识别技术全面总结：从传统方法到深度学习

人脸识别技术全面总结：从传统方法到深度学习

算法与数学之美

12+阅读 · 2019年2月27日

清华大学发布：人脸识别最全知识图谱

清华大学发布：人脸识别最全知识图谱

全球创新论坛

10+阅读 · 2018年11月21日

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

专知

14+阅读 · 2018年2月4日

人脸表情分类与识别：人脸检测+情绪分类

人脸表情分类与识别：人脸检测+情绪分类

北京思腾合力科技有限公司

27+阅读 · 2017年12月18日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

人脸检测与识别总结

人脸检测与识别总结

计算机视觉战队

21+阅读 · 2017年11月29日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

语音识别之--韩语语音识别

语音识别之--韩语语音识别

微信AI

16+阅读 · 2017年8月2日

面向网络虚拟化的网络层可信身份验证机制研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于因子分析的会话语音说话人识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于毛孔尺度面部特征的高效人脸识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于社交网络的安全性身份认证的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

5+阅读 · 2014年12月31日

Speaking Without Sound: Multi-speaker Silent Speech Voicing with Facial Inputs Only

Arxiv

0+阅读 · 2月2日

Speech Emotion Recognition with ASR Integration

Arxiv

0+阅读 · 1月30日

A Hybrid Discriminative and Generative System for Universal Speech Enhancement

Arxiv

0+阅读 · 1月27日

Language-Guided and Motion-Aware Gait Representation for Generalizable Recognition

Arxiv

0+阅读 · 1月23日

Survey of End-to-End Multi-Speaker Automatic Speech Recognition for Monaural Audio

Arxiv

0+阅读 · 1月13日

Quantum Secure Biometric Authentication in Decentralised Systems

Arxiv

0+阅读 · 1月8日

SyncLipMAE: Contrastive Masked Pretraining for Audio-Visual Talking-Face Representation

Arxiv

0+阅读 · 1月6日

Vulnerabilities of Audio-Based Biometric Authentication Systems Against Deepfake Speech Synthesis

Arxiv

0+阅读 · 1月6日

Multi-channel multi-speaker transformer for speech recognition

Arxiv

0+阅读 · 1月6日

VerLM: Explaining Face Verification Using Natural Language

Arxiv

0+阅读 · 1月5日

VIP会员

文章信息

相关主题

最新内容

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

4+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

6+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

6+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

4+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

7+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

6+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

9+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

10+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

15+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

16+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

11+阅读 · 7月18日

相关VIP内容

最新！《信息技术生物特征识别人脸识别系统测试方法》国家标准意见稿发布

最新！《信息技术生物特征识别人脸识别系统测试方法》国家标准意见稿发布

专知会员服务

33+阅读 · 2022年4月11日

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

【Science Advances】MIT最新论文《特化类脑功能在深度神经网络中自发应用》，人脸识别的优化解决方案

专知会员服务

16+阅读 · 2022年4月10日

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

专知会员服务

21+阅读 · 2022年3月22日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

人脸亲子关系验证研究综述

专知会员服务

21+阅读 · 2021年5月20日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

视频人脸识别进展综述

视频人脸识别进展综述

专知会员服务

56+阅读 · 2021年3月12日

【ACL2020-亚马逊】Transformers多分辨率和多模态语音识别，Multiresolution and Multimodal Speech Recognition with Transformers

【ACL2020-亚马逊】Transformers多分辨率和多模态语音识别，Multiresolution and Multimodal Speech Recognition with Transformers

专知会员服务

15+阅读 · 2020年5月5日

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

专知会员服务

24+阅读 · 2020年3月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

印度精确打击与指挥架构的断层

美空军AI完成F-16战斗机自主空战历史性试飞

相关资讯

计算机视觉方向简介 | 人脸表情识别

计算机视觉方向简介 | 人脸表情识别

计算机视觉life

36+阅读 · 2019年5月15日

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

专知

14+阅读 · 2019年4月17日

人脸识别技术全面总结：从传统方法到深度学习

人脸识别技术全面总结：从传统方法到深度学习

算法与数学之美

12+阅读 · 2019年2月27日

清华大学发布：人脸识别最全知识图谱

清华大学发布：人脸识别最全知识图谱

全球创新论坛

10+阅读 · 2018年11月21日

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

专知

14+阅读 · 2018年2月4日

人脸表情分类与识别：人脸检测+情绪分类

人脸表情分类与识别：人脸检测+情绪分类

北京思腾合力科技有限公司

27+阅读 · 2017年12月18日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

人脸检测与识别总结

人脸检测与识别总结

计算机视觉战队

21+阅读 · 2017年11月29日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

语音识别之--韩语语音识别

语音识别之--韩语语音识别

微信AI

16+阅读 · 2017年8月2日

相关论文

Speaking Without Sound: Multi-speaker Silent Speech Voicing with Facial Inputs Only

Arxiv

0+阅读 · 2月2日

Speech Emotion Recognition with ASR Integration

Arxiv

0+阅读 · 1月30日

A Hybrid Discriminative and Generative System for Universal Speech Enhancement

Arxiv

0+阅读 · 1月27日

Language-Guided and Motion-Aware Gait Representation for Generalizable Recognition

Arxiv

0+阅读 · 1月23日

Survey of End-to-End Multi-Speaker Automatic Speech Recognition for Monaural Audio

Arxiv

0+阅读 · 1月13日

Quantum Secure Biometric Authentication in Decentralised Systems

Arxiv

0+阅读 · 1月8日

SyncLipMAE: Contrastive Masked Pretraining for Audio-Visual Talking-Face Representation

Arxiv

0+阅读 · 1月6日

Vulnerabilities of Audio-Based Biometric Authentication Systems Against Deepfake Speech Synthesis

Arxiv

0+阅读 · 1月6日

Multi-channel multi-speaker transformer for speech recognition

Arxiv

0+阅读 · 1月6日

VerLM: Explaining Face Verification Using Natural Language

Arxiv

0+阅读 · 1月5日

相关基金

面向网络虚拟化的网络层可信身份验证机制研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于因子分析的会话语音说话人识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于毛孔尺度面部特征的高效人脸识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于社交网络的安全性身份认证的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

5+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员