Inverse kinematics (IK) is a core operation in animation, robotics, and biomechanics: given Cartesian constraints, recover joint rotations under a known kinematic tree. In many real-time human avatar pipelines, the available signal per frame is a sparse set of tracked 3D joint positions, whereas animation systems require joint orientations to drive skinning. Recovering full orientations from positions is underconstrained, most notably because twist about bone axes is ambiguous, and classical IK solvers typically rely on iterative optimization that can be slow and sensitive to noisy inputs. We introduce IK-GAT, a lightweight graph-attention network that reconstructs full-body joint orientations from 3D joint positions in a single forward pass. The model performs message passing over the skeletal parent-child graph to exploit kinematic structure during rotation inference. To simplify learning, IK-GAT predicts rotations in a bone-aligned world-frame representation anchored to rest-pose bone frames. This parameterization makes the twist axis explicit and is exactly invertible to standard parent-relative local rotations given the kinematic tree and rest pose. The network uses a continuous 6D rotation representation and is trained with a geodesic loss on SO(3) together with an optional forward-kinematics consistency regularizer. IK-GAT produces animation-ready local rotations that can directly drive a rigged avatar or be converted to pose parameters of SMPL-like body models for real-time and online applications. With 374K parameters and over 650 FPS on CPU, IK-GAT outperforms VPoser-based per-frame iterative optimization without warm-start at significantly lower cost, and is robust to initial pose and input noise


翻译:逆运动学(IK)是动画、机器人学和生物力学中的核心操作:在给定笛卡尔约束条件下,根据已知运动学树恢复关节旋转。在许多实时人体化身管线中,每帧可获取的信号是一组稀疏的3D关节位置,而动画系统需要关节朝向以驱动蒙皮。从位置恢复完整朝向是欠约束的,最显著的问题在于骨骼轴向上的扭转具有歧义性,而经典IK求解器通常依赖迭代优化,这可能导致计算缓慢且对噪声输入敏感。本文提出IK-GAT——一种轻量级图注意力网络,能够通过单次前向传播从3D关节位置重建全身关节朝向。该模型在骨骼父子图上进行消息传递,从而在旋转推理中利用运动学结构。为简化学习过程,IK-GAT采用基于骨骼对齐的世界坐标系表示,该表示锚定于静止姿态的骨骼帧,将扭转轴显式化,并可基于运动学树与静止姿态精确逆变换为标准的父级相对局部旋转。网络采用连续6维旋转表示,并通过SO(3)上的测地损失与可选的(前向运动学一致性正则化项)联合训练。IK-GAT生成的动画就绪局部旋转可直接驱动绑定化身,或转换为SMPL类人体模型姿态参数,适用于实时与在线应用。该模型仅含374K参数,在CPU上运行速度超过650 FPS,以显著更低的计算成本超越了无热启动的基于VPoser的逐帧迭代优化,且对初始姿态与输入噪声具有鲁棒性。

0
下载
关闭预览

相关内容

图注意力网络(Graph Attention Network,GAT),它通过注意力机制(Attention Mechanism)来对邻居节点做聚合操作,实现了对不同邻居权重的自适应分配,从而大大提高了图神经网络模型的表达能力。
从图像去噪到成像逆问题的正则化:综述
专知会员服务
14+阅读 · 2025年9月4日
【NeurIPS2024】注意力迁移对视觉Transformer的惊人有效性研究
虚拟人运动控制策略学习方法的研究进展与展望
专知会员服务
19+阅读 · 2024年8月17日
用Attention玩转CV,一文总览自注意力语义分割进展
多图带你读懂 Transformers 的工作原理
AI研习社
10+阅读 · 2019年3月18日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
6+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员