FGTBT: Frequency-Guided Task-Balancing Transformer for Unified Facial Landmark Detection - 专知论文

会员服务 ·

0

结构 · 人脸 · 数据集 · 人脸关键点检测 · 关键点检测 ·

FGTBT: Frequency-Guided Task-Balancing Transformer for Unified Facial Landmark Detection

翻译：FGTBT：面向统一人脸关键点检测的频率引导任务平衡Transformer

Jun Wan,Xinyu Xiong,Ning Chen,Zhihui Lai,Jie Zhou,Wenwen Min

Recently, deep learning based facial landmark detection (FLD) methods have achieved considerable success. However, in challenging scenarios such as large pose variations, illumination changes, and facial expression variations, they still struggle to accurately capture the geometric structure of the face, resulting in performance degradation. Moreover, the limited size and diversity of existing FLD datasets hinder robust model training, leading to reduced detection accuracy. To address these challenges, we propose a Frequency-Guided Task-Balancing Transformer (FGTBT), which enhances facial structure perception through frequency-domain modeling and multi-dataset unified training. Specifically, we propose a novel Fine-Grained Multi-Task Balancing loss (FMB-loss), which moves beyond coarse task-level balancing by assigning weights to individual landmarks based on their occurrence across datasets. This enables more effective unified training and mitigates the issue of inconsistent gradient magnitudes. Additionally, a Frequency-Guided Structure-Aware (FGSA) model is designed to utilize frequency-guided structure injection and regularization to help learn facial structure constraints. Extensive experimental results on popular benchmark datasets demonstrate that the integration of the proposed FMB-loss and FGSA model into our FGTBT framework achieves performance comparable to state-of-the-art methods. The code is available at https://github.com/Xi0ngxinyu/FGTBT.

翻译：近年来，基于深度学习的人脸关键点检测方法取得了显著成功。然而，在诸如大姿态变化、光照变化和面部表情变化等具有挑战性的场景中，这些方法仍难以准确捕捉人脸的几何结构，导致性能下降。此外，现有FLD数据集的规模和多样性有限，阻碍了模型的鲁棒性训练，从而降低了检测精度。为应对这些挑战，我们提出了一种频率引导任务平衡Transformer，该模型通过频域建模和多数据集统一训练来增强面部结构感知。具体而言，我们提出了一种新颖的细粒度多任务平衡损失函数，它超越了粗粒度的任务级平衡，通过根据各个关键点在不同数据集中的出现频率为其分配权重。这使得统一训练更加有效，并缓解了梯度幅度不一致的问题。此外，我们设计了一个频率引导结构感知模型，该模型利用频率引导的结构注入和正则化来帮助学习面部结构约束。在多个流行基准数据集上的大量实验结果表明，将所提出的FMB损失函数和FGSA模型集成到我们的FGTBT框架中，实现了与最先进方法相媲美的性能。代码可在 https://github.com/Xi0ngxinyu/FGTBT 获取。

0

相关内容

《Transformer小目标检测》最新综述

《Transformer小目标检测》最新综述

专知会员服务

60+阅读 · 2023年9月13日

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

专知会员服务

21+阅读 · 2022年3月22日

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

专知会员服务

17+阅读 · 2022年3月19日

【ICLR2022】UniFormer：无缝集成 Transformer，更高效的时空表征学习框架

【ICLR2022】UniFormer：无缝集成 Transformer，更高效的时空表征学习框架

专知会员服务

50+阅读 · 2022年2月16日

一文读懂3D人脸识别十年发展及未来趋势

专知会员服务

12+阅读 · 2021年10月14日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

最新《端到端人脸识别》2020综述论文，44页pdf

专知会员服务

80+阅读 · 2020年10月2日

最新《深度学习人脸识别》综述论文，

最新《深度学习人脸识别》综述论文，

专知会员服务

68+阅读 · 2020年8月10日

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

专知会员服务

24+阅读 · 2020年3月20日

人脸静默活体检测最新综述

人脸静默活体检测最新综述

PaperWeekly

14+阅读 · 2020年8月9日

人脸相关文献代码集锦：人脸检测、人脸识别、人脸生成等

人脸相关文献代码集锦：人脸检测、人脸识别、人脸生成等

专知

15+阅读 · 2019年5月20日

PFLD：简单高效的实用人脸关键点检测算法

PFLD：简单高效的实用人脸关键点检测算法

PaperWeekly

20+阅读 · 2019年4月17日

人脸专集3 | 人脸关键点检测（下）—文末源码

人脸专集3 | 人脸关键点检测（下）—文末源码

计算机视觉战队

19+阅读 · 2019年4月8日

人脸专集2 | 人脸关键点检测汇总（文末有相关文章链接）

人脸专集2 | 人脸关键点检测汇总（文末有相关文章链接）

计算机视觉战队

25+阅读 · 2019年4月4日

浅谈FRVT人脸识别测评

浅谈FRVT人脸识别测评

人工智能前沿讲习班

12+阅读 · 2018年7月9日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

机器之心

15+阅读 · 2018年3月11日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

人脸检测与识别总结

人脸检测与识别总结

计算机视觉战队

21+阅读 · 2017年11月29日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于深度信念网络的高光谱遥感影像变化检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于结构特征的人脸识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于毛孔尺度面部特征的高效人脸识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

人脸皮肤软组织跨尺度变形测量与表情形成机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

Semantic-Guided Two-Stage GAN for Face Inpainting with Hybrid Perceptual Encoding

Arxiv

0+阅读 · 2月15日

FaceQSORT: a Multi-Face Tracking Method based on Biometric and Appearance Features

Arxiv

0+阅读 · 2月12日

OccFace: Unified Occlusion-Aware Facial Landmark Detection with Per-Point Visibility

Arxiv

0+阅读 · 2月11日

Exploring Specular Reflection Inconsistency for Generalizable Face Forgery Detection

Arxiv

0+阅读 · 2月6日

FD-MAD: Frequency-Domain Residual Analysis for Face Morphing Attack Detection

Arxiv

0+阅读 · 1月28日

Unified-EGformer: Exposure Guided Lightweight Transformer for Mixed-Exposure Image Enhancement

Arxiv

0+阅读 · 1月25日

Supervision-by-Hallucination-and-Transfer: A Weakly-Supervised Approach for Robust and Precise Facial Landmark Detection

Arxiv

0+阅读 · 1月19日

ManipShield: A Unified Framework for Image Manipulation Detection, Localization and Explanation

Arxiv

0+阅读 · 1月19日

DFIR-DETR: Frequency Domain Enhancement and Dynamic Feature Aggregation for Cross-Scene Small Object Detection

Arxiv

1+阅读 · 1月15日

SPOT-Face: Forensic Face Identification using Attention Guided Optimal Transport

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

人脸关键点检测

关键点检测

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

5+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

10+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

《Transformer小目标检测》最新综述

《Transformer小目标检测》最新综述

专知会员服务

60+阅读 · 2023年9月13日

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

专知会员服务

21+阅读 · 2022年3月22日

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

专知会员服务

17+阅读 · 2022年3月19日

【ICLR2022】UniFormer：无缝集成 Transformer，更高效的时空表征学习框架

【ICLR2022】UniFormer：无缝集成 Transformer，更高效的时空表征学习框架

专知会员服务

50+阅读 · 2022年2月16日

一文读懂3D人脸识别十年发展及未来趋势

专知会员服务

12+阅读 · 2021年10月14日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

最新《端到端人脸识别》2020综述论文，44页pdf

专知会员服务

80+阅读 · 2020年10月2日

最新《深度学习人脸识别》综述论文，

最新《深度学习人脸识别》综述论文，

专知会员服务

68+阅读 · 2020年8月10日

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

专知会员服务

24+阅读 · 2020年3月20日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

人脸静默活体检测最新综述

人脸静默活体检测最新综述

PaperWeekly

14+阅读 · 2020年8月9日

人脸相关文献代码集锦：人脸检测、人脸识别、人脸生成等

人脸相关文献代码集锦：人脸检测、人脸识别、人脸生成等

专知

15+阅读 · 2019年5月20日

PFLD：简单高效的实用人脸关键点检测算法

PFLD：简单高效的实用人脸关键点检测算法

PaperWeekly

20+阅读 · 2019年4月17日

人脸专集3 | 人脸关键点检测（下）—文末源码

人脸专集3 | 人脸关键点检测（下）—文末源码

计算机视觉战队

19+阅读 · 2019年4月8日

人脸专集2 | 人脸关键点检测汇总（文末有相关文章链接）

人脸专集2 | 人脸关键点检测汇总（文末有相关文章链接）

计算机视觉战队

25+阅读 · 2019年4月4日

浅谈FRVT人脸识别测评

浅谈FRVT人脸识别测评

人工智能前沿讲习班

12+阅读 · 2018年7月9日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

机器之心

15+阅读 · 2018年3月11日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

人脸检测与识别总结

人脸检测与识别总结

计算机视觉战队

21+阅读 · 2017年11月29日

相关论文

Semantic-Guided Two-Stage GAN for Face Inpainting with Hybrid Perceptual Encoding

Arxiv

0+阅读 · 2月15日

FaceQSORT: a Multi-Face Tracking Method based on Biometric and Appearance Features

Arxiv

0+阅读 · 2月12日

OccFace: Unified Occlusion-Aware Facial Landmark Detection with Per-Point Visibility

Arxiv

0+阅读 · 2月11日

Exploring Specular Reflection Inconsistency for Generalizable Face Forgery Detection

Arxiv

0+阅读 · 2月6日

FD-MAD: Frequency-Domain Residual Analysis for Face Morphing Attack Detection

Arxiv

0+阅读 · 1月28日

Unified-EGformer: Exposure Guided Lightweight Transformer for Mixed-Exposure Image Enhancement

Arxiv

0+阅读 · 1月25日

Supervision-by-Hallucination-and-Transfer: A Weakly-Supervised Approach for Robust and Precise Facial Landmark Detection

Arxiv

0+阅读 · 1月19日

ManipShield: A Unified Framework for Image Manipulation Detection, Localization and Explanation

Arxiv

0+阅读 · 1月19日

DFIR-DETR: Frequency Domain Enhancement and Dynamic Feature Aggregation for Cross-Scene Small Object Detection

Arxiv

1+阅读 · 1月15日

SPOT-Face: Forensic Face Identification using Attention Guided Optimal Transport

Arxiv

0+阅读 · 1月14日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于深度信念网络的高光谱遥感影像变化检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于结构特征的人脸识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于毛孔尺度面部特征的高效人脸识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

人脸皮肤软组织跨尺度变形测量与表情形成机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员