Group Representational Position Encoding - 专知论文

会员服务 ·

0

位置编码 · 加法 · 表示 · 子空间 · 偏置 ·

Group Representational Position Encoding

翻译：群表示位置编码

Yifan Zhang,Zixiang Chen,Yifeng Liu,Zhen Qin,Huizhuo Yuan,Kangping Xu,Yang Yuan,Quanquan Gu,Andrew Chi-Chih Yao

from arxiv, Published in ICLR 2026; Project Page: https://github.com/model-architectures/GRAPE

We present GRAPE (Group Representational Position Encoding), a unified framework for positional encoding based on group actions. GRAPE unifies two families of mechanisms: (i) multiplicative rotations (Multiplicative GRAPE) in $\operatorname{SO}(d)$ and (ii) additive logit biases (Additive GRAPE) arising from unipotent actions in the general linear group $\mathrm{GL}$. In Multiplicative GRAPE, a position $n \in \mathbb{Z}$ (or $t \in \mathbb{R}$) acts as $\mathbf{G}(n) = \exp(n \, ω\, \mathbf{L})$ with a rank-2 skew-symmetric generator $\mathbf{L} \in \mathbb{R}^{d \times d}$, yielding a relative, compositional, norm-preserving map with a closed-form matrix exponential. RoPE is recovered exactly when the $d/2$ planes correspond to canonical coordinate pairs with a log-uniform spectrum. Learned commuting subspaces and compact non-commuting mixtures strictly extend this geometry to capture cross-subspace feature coupling at $O(d)$ and $O(r d)$ cost per head, respectively. In Additive GRAPE, additive logits arise from rank-1 (or low-rank) unipotent actions, recovering ALiBi and the Forgetting Transformer (FoX) as exact special cases while preserving an exact relative law and streaming cacheability. Overall, GRAPE provides a principled design space for positional geometry in long-context models, subsuming RoPE and ALiBi as special cases. Project page: https://github.com/model-architectures/GRAPE.

翻译：我们提出了GRAPE（群表示位置编码），一个基于群作用的统一位置编码框架。GRAPE统一了两类机制：(i) $\operatorname{SO}(d)$ 中的乘法旋转（乘法GRAPE）与 (ii) 由一般线性群 $\mathrm{GL}$ 中幂幺作用产生的加法对数偏置（加法GRAPE）。在乘法GRAPE中，位置 $n \in \mathbb{Z}$（或 $t \in \mathbb{R}$）通过 $\mathbf{G}(n) = \exp(n \, ω\, \mathbf{L})$ 作用，其中 $\mathbf{L} \in \mathbb{R}^{d \times d}$ 是一个秩为2的斜对称生成元，从而产生一个相对的、可组合的、保范的映射，并具有闭式矩阵指数。当 $d/2$ 个平面对应于具有对数均匀谱的规范坐标对时，可精确恢复RoPE。学习到的交换子空间与紧致的非交换混合分别以每个注意力头 $O(d)$ 和 $O(r d)$ 的代价，严格扩展了此几何结构以捕捉跨子空间的特征耦合。在加法GRAPE中，加法对数来自秩为1（或低秩）的幂幺作用，将ALiBi与遗忘Transformer（FoX）作为精确特例恢复，同时保留了精确的相对律与流式缓存能力。总体而言，GRAPE为长上下文模型中的位置几何提供了一个原则性的设计空间，将RoPE和ALiBi纳入为特例。项目页面：https://github.com/model-architectures/GRAPE。

0

相关内容

位置编码

【CVPR2024】GroupContrast：语义感知的自监督表示学习用于三维理解

【CVPR2024】GroupContrast：语义感知的自监督表示学习用于三维理解

专知会员服务

18+阅读 · 2024年3月15日

《航空蜂群在区域探索中的最优路径规划》69页

《航空蜂群在区域探索中的最优路径规划》69页

专知会员服务

50+阅读 · 2024年1月15日

《集群概念和蜂群无人机系统》中文版

《集群概念和蜂群无人机系统》中文版

专知会员服务

199+阅读 · 2023年7月4日

《集群机器人中自组织任务分配的全局到局部设计》2022最新12页论文，布鲁塞尔自由大学等

《集群机器人中自组织任务分配的全局到局部设计》2022最新12页论文，布鲁塞尔自由大学等

专知会员服务

52+阅读 · 2022年11月14日

《分布式多智能体强化学习的编码》加州大学等

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

56+阅读 · 2022年11月2日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【ICML2021】具有线性复杂度的Transformer的相对位置编码

【ICML2021】具有线性复杂度的Transformer的相对位置编码

专知会员服务

25+阅读 · 2021年5月20日

【硬核书】群论，Group Theory，135页pdf

【硬核书】群论，Group Theory，135页pdf

专知会员服务

130+阅读 · 2020年6月25日

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

专知会员服务

12+阅读 · 2020年4月6日

【论文】知识图嵌入的群表示理论（Group Representation Theory for Knowledge Graph Embedding），俄亥俄州立大学| Chen Cai

【论文】知识图嵌入的群表示理论（Group Representation Theory for Knowledge Graph Embedding），俄亥俄州立大学| Chen Cai

专知会员服务

31+阅读 · 2019年12月30日

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

26+阅读 · 2021年1月30日

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

专知

19+阅读 · 2019年11月22日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

Seq2seq强化，Pointer Network简介

Seq2seq强化，Pointer Network简介

机器学习算法与Python学习

15+阅读 · 2018年12月8日

变分自编码器VAE：一步到位的聚类方案

变分自编码器VAE：一步到位的聚类方案

PaperWeekly

25+阅读 · 2018年9月18日

干货：基于用户画像的聚类分析

干货：基于用户画像的聚类分析

数据分析

22+阅读 · 2018年5月17日

【论文推荐】最新八篇网络节点表示相关论文—可扩展嵌入、对抗自编码器、图划分、异构信息、显式矩阵分解、深度高斯、图、随机游走

【论文推荐】最新八篇网络节点表示相关论文—可扩展嵌入、对抗自编码器、图划分、异构信息、显式矩阵分解、深度高斯、图、随机游走

专知

14+阅读 · 2018年3月30日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

牵制控制框架下符号网络的群体行为研究

国家自然科学基金

2+阅读 · 2017年12月31日

高速率、高频谱效率码分多址系统地址码设计研究

国家自然科学基金

0+阅读 · 2015年12月31日

多信源协作网络编码与QC-LDPC码的联合设计和迭代译码研究

国家自然科学基金

0+阅读 · 2015年12月31日

若干类广义正则半群代数结构的研究

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

对称分类、整体群表示和不变参数化格式研究

国家自然科学基金

0+阅读 · 2015年12月31日

合作竞争网络中异质个体的群集行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于矩阵半群的公钥密码体制研究

国家自然科学基金

0+阅读 · 2014年12月31日

一般半群和广义正则半群的代数理论

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

CSS codes from the Bruhat order of Coxeter groups

Arxiv

0+阅读 · 3月17日

Population Protocols Revisited: Parity and Beyond

Arxiv

0+阅读 · 3月14日

Demystifying Group Relative Policy Optimization: Its Policy Gradient is a U-Statistic

Arxiv

0+阅读 · 3月3日

Concatenated Sum-Rank Codes

Arxiv

0+阅读 · 2月25日

Positional $ω$-regular languages

Arxiv

0+阅读 · 2月23日

A group structure arising from Grover walks on complete graphs with self-loops and its application

Arxiv

0+阅读 · 2月14日

Cryptographic Choreographies

Arxiv

0+阅读 · 2月13日

Dualities of dihedral and generalised quaternion codes and applications to quantum codes

Arxiv

0+阅读 · 2月4日

On the Parallel Complexity of Identifying Groups and Quasigroups via Decompositions

Arxiv

0+阅读 · 2月3日

Group Contrastive Learning for Weakly Paired Multimodal Data

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

4+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

2+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

2+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

3+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

4+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

3+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

【CVPR2024】GroupContrast：语义感知的自监督表示学习用于三维理解

【CVPR2024】GroupContrast：语义感知的自监督表示学习用于三维理解

专知会员服务

18+阅读 · 2024年3月15日

《航空蜂群在区域探索中的最优路径规划》69页

《航空蜂群在区域探索中的最优路径规划》69页

专知会员服务

50+阅读 · 2024年1月15日

《集群概念和蜂群无人机系统》中文版

《集群概念和蜂群无人机系统》中文版

专知会员服务

199+阅读 · 2023年7月4日

《集群机器人中自组织任务分配的全局到局部设计》2022最新12页论文，布鲁塞尔自由大学等

《集群机器人中自组织任务分配的全局到局部设计》2022最新12页论文，布鲁塞尔自由大学等

专知会员服务

52+阅读 · 2022年11月14日

《分布式多智能体强化学习的编码》加州大学等

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

56+阅读 · 2022年11月2日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【ICML2021】具有线性复杂度的Transformer的相对位置编码

【ICML2021】具有线性复杂度的Transformer的相对位置编码

专知会员服务

25+阅读 · 2021年5月20日

【硬核书】群论，Group Theory，135页pdf

【硬核书】群论，Group Theory，135页pdf

专知会员服务

130+阅读 · 2020年6月25日

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

专知会员服务

12+阅读 · 2020年4月6日

【论文】知识图嵌入的群表示理论（Group Representation Theory for Knowledge Graph Embedding），俄亥俄州立大学| Chen Cai

【论文】知识图嵌入的群表示理论（Group Representation Theory for Knowledge Graph Embedding），俄亥俄州立大学| Chen Cai

专知会员服务

31+阅读 · 2019年12月30日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

【AAAI2021】对比聚类，Contrastive Clustering

【AAAI2021】对比聚类，Contrastive Clustering

专知

26+阅读 · 2021年1月30日

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

专知

19+阅读 · 2019年11月22日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

Seq2seq强化，Pointer Network简介

Seq2seq强化，Pointer Network简介

机器学习算法与Python学习

15+阅读 · 2018年12月8日

变分自编码器VAE：一步到位的聚类方案

变分自编码器VAE：一步到位的聚类方案

PaperWeekly

25+阅读 · 2018年9月18日

干货：基于用户画像的聚类分析

干货：基于用户画像的聚类分析

数据分析

22+阅读 · 2018年5月17日

【论文推荐】最新八篇网络节点表示相关论文—可扩展嵌入、对抗自编码器、图划分、异构信息、显式矩阵分解、深度高斯、图、随机游走

【论文推荐】最新八篇网络节点表示相关论文—可扩展嵌入、对抗自编码器、图划分、异构信息、显式矩阵分解、深度高斯、图、随机游走

专知

14+阅读 · 2018年3月30日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

CSS codes from the Bruhat order of Coxeter groups

Arxiv

0+阅读 · 3月17日

Population Protocols Revisited: Parity and Beyond

Arxiv

0+阅读 · 3月14日

Demystifying Group Relative Policy Optimization: Its Policy Gradient is a U-Statistic

Arxiv

0+阅读 · 3月3日

Concatenated Sum-Rank Codes

Arxiv

0+阅读 · 2月25日

Positional $ω$-regular languages

Arxiv

0+阅读 · 2月23日

A group structure arising from Grover walks on complete graphs with self-loops and its application

Arxiv

0+阅读 · 2月14日

Cryptographic Choreographies

Arxiv

0+阅读 · 2月13日

Dualities of dihedral and generalised quaternion codes and applications to quantum codes

Arxiv

0+阅读 · 2月4日

On the Parallel Complexity of Identifying Groups and Quasigroups via Decompositions

Arxiv

0+阅读 · 2月3日

Group Contrastive Learning for Weakly Paired Multimodal Data

Arxiv

0+阅读 · 2月3日

相关基金

牵制控制框架下符号网络的群体行为研究

国家自然科学基金

2+阅读 · 2017年12月31日

高速率、高频谱效率码分多址系统地址码设计研究

国家自然科学基金

0+阅读 · 2015年12月31日

多信源协作网络编码与QC-LDPC码的联合设计和迭代译码研究

国家自然科学基金

0+阅读 · 2015年12月31日

若干类广义正则半群代数结构的研究

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

对称分类、整体群表示和不变参数化格式研究

国家自然科学基金

0+阅读 · 2015年12月31日

合作竞争网络中异质个体的群集行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于矩阵半群的公钥密码体制研究

国家自然科学基金

0+阅读 · 2014年12月31日

一般半群和广义正则半群的代数理论

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员