Temporal Credit Is Free - 专知论文

会员服务 ·

0

归一化 · 梯度 · 循环网络 · 环网 · 在线 ·

Temporal Credit Is Free

翻译：时间信用是免费的

Aur Shalev Merin

from arxiv, 16 pages, 4 figures, 5 tables

Recurrent networks do not need Jacobian propagation to adapt online. The hidden state already carries temporal credit through the forward pass; immediate derivatives suffice if you stop corrupting them with stale trace memory and normalize gradient scales across parameter groups. An architectural rule predicts when normalization is needed: \b{eta}2 is required when gradients must pass through a nonlinear state update with no output bypass, and unnecessary otherwise. Across ten architectures, real primate neural data, and streaming ML benchmarks, immediate derivatives with RMSprop match or exceed full RTRL, scaling to n = 1024 at 1000x less memory.

翻译：循环网络进行在线自适应时无需通过雅可比传播。隐藏状态已通过前向传播携带时间信用；若停止使用过时的迹记忆破坏即时导数，并在参数组间归一化梯度尺度，仅凭即时导数便已足够。一项架构规则可预测何时需要归一化：当梯度必须经过非线性状态更新且无输出旁路时，需使用β²；否则无需归一化。在十种架构、真实的灵长类神经数据及流式机器学习基准测试中，采用RMSprop的即时导数表现与完整RTRL相当甚至更优，可扩展至n=1024且内存消耗降低1000倍。

0

相关内容

归一化

何恺明&Lecun新论文CVPR2025《无需归一化的 Transformer》

何恺明&Lecun新论文CVPR2025《无需归一化的 Transformer》

专知会员服务

18+阅读 · 2025年3月15日

【AAAI2024】TimesURL: 自监着对比学习在通用时间序列表征学习中的应用

【AAAI2024】TimesURL: 自监着对比学习在通用时间序列表征学习中的应用

专知会员服务

35+阅读 · 2023年12月28日

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

专知会员服务

33+阅读 · 2023年12月1日

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

专知会员服务

72+阅读 · 2023年6月24日

【AAAI2022】基于对比时空前置学习的视频自监督表示

【AAAI2022】基于对比时空前置学习的视频自监督表示

专知会员服务

20+阅读 · 2021年12月19日

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

专知会员服务

17+阅读 · 2021年3月24日

【KDD2020】百度地图上用于估计旅行时间的上下文时空图注意网络

专知会员服务

23+阅读 · 2020年10月19日

【CVPR2020】视觉推理-可微自适应计算时间

【CVPR2020】视觉推理-可微自适应计算时间

专知会员服务

13+阅读 · 2020年4月28日

【加拿大Sherbrooke】金融时间序列表示学习，Financial Time Series RL

【加拿大Sherbrooke】金融时间序列表示学习，Financial Time Series RL

专知会员服务

44+阅读 · 2020年3月30日

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

专知会员服务

31+阅读 · 2020年1月11日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

无监督分词和句法分析！原来BERT还可以这样用

无监督分词和句法分析！原来BERT还可以这样用

PaperWeekly

12+阅读 · 2020年6月17日

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知

31+阅读 · 2020年4月24日

宾夕法尼亚大学教授用1900页讲透了计算机科学数学基础，还是免费的！

宾夕法尼亚大学教授用1900页讲透了计算机科学数学基础，还是免费的！

算法与数据结构

51+阅读 · 2019年8月9日

你真的懂时间序列预测吗？

你真的懂时间序列预测吗？

腾讯大讲堂

104+阅读 · 2019年1月7日

利用动态深度学习预测金融时间序列基于Python

利用动态深度学习预测金融时间序列基于Python

量化投资与机器学习

18+阅读 · 2018年10月30日

时间卷积网络（TCN）将取代RNN成为NLP预测领域王者

时间卷积网络（TCN）将取代RNN成为NLP预测领域王者

AI前线

11+阅读 · 2018年5月14日

AWS 上可用的公用数据集，任何人都可以免费访问

AWS 上可用的公用数据集，任何人都可以免费访问

AI研习社

11+阅读 · 2018年4月2日

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

专知

23+阅读 · 2018年1月17日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

卫星导航系统时间溯源新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

时空上下文感知的云服务质量预测和推荐的研究

国家自然科学基金

0+阅读 · 2015年12月31日

混沌时间序列Volterra建模及其在语音信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

云计算环境信任链系统安全性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

延迟容忍网络中自适应社会感知路由研究

国家自然科学基金

0+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

应用服务保障完成时限的网络传输机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态网络中信息传播时间的理论分析与跨层算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

离散时间马氏链的泛函不等式及遍历性

国家自然科学基金

0+阅读 · 2014年12月31日

Zero-Trust Bilateral Edge Service Trading with Deposit-Refund Regulation for Runtime Compliance

Arxiv

0+阅读 · 5月4日

FreeOcc: Training-Free Embodied Open-Vocabulary Occupancy Prediction

Arxiv

0+阅读 · 4月30日

Probing for Better Age of Information in Energy-Harvesting Random Access Networks

Arxiv

0+阅读 · 4月28日

Temporal Representations for Exploration: Learning Complex Exploratory Behavior without Extrinsic Rewards

Arxiv

0+阅读 · 4月19日

Time is Not a Label: Continuous Phase Rotation for Temporal Knowledge Graphs and Agentic Memory

Arxiv

0+阅读 · 4月13日

Physics-Informed Transformer for Real-Time High-Fidelity Topology Optimization

Arxiv

0+阅读 · 4月4日

Inversion-Free Natural Gradient Descent on Riemannian Manifolds

Arxiv

0+阅读 · 4月3日

Massive Redundancy in Gradient Transport Enables Sparse Online Learning

Arxiv

0+阅读 · 3月27日

Stabilizing a linear system using phone calls when time is information

Arxiv

0+阅读 · 3月27日

Compliance as a Trust Metric

Arxiv

0+阅读 · 3月24日

VIP会员

文章信息

相关主题

最新内容

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

7+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

5+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

6+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

4+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

8+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

7+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

4+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

2+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

5+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

3+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

4+阅读 · 7月17日

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

12+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

14+阅读 · 7月16日

相关VIP内容

何恺明&Lecun新论文CVPR2025《无需归一化的 Transformer》

何恺明&Lecun新论文CVPR2025《无需归一化的 Transformer》

专知会员服务

18+阅读 · 2025年3月15日

【AAAI2024】TimesURL: 自监着对比学习在通用时间序列表征学习中的应用

【AAAI2024】TimesURL: 自监着对比学习在通用时间序列表征学习中的应用

专知会员服务

35+阅读 · 2023年12月28日

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

专知会员服务

33+阅读 · 2023年12月1日

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

专知会员服务

72+阅读 · 2023年6月24日

【AAAI2022】基于对比时空前置学习的视频自监督表示

【AAAI2022】基于对比时空前置学习的视频自监督表示

专知会员服务

20+阅读 · 2021年12月19日

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

专知会员服务

17+阅读 · 2021年3月24日

【KDD2020】百度地图上用于估计旅行时间的上下文时空图注意网络

专知会员服务

23+阅读 · 2020年10月19日

【CVPR2020】视觉推理-可微自适应计算时间

【CVPR2020】视觉推理-可微自适应计算时间

专知会员服务

13+阅读 · 2020年4月28日

【加拿大Sherbrooke】金融时间序列表示学习，Financial Time Series RL

【加拿大Sherbrooke】金融时间序列表示学习，Financial Time Series RL

专知会员服务

44+阅读 · 2020年3月30日

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

专知会员服务

31+阅读 · 2020年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

相关资讯

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

无监督分词和句法分析！原来BERT还可以这样用

无监督分词和句法分析！原来BERT还可以这样用

PaperWeekly

12+阅读 · 2020年6月17日

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知

31+阅读 · 2020年4月24日

宾夕法尼亚大学教授用1900页讲透了计算机科学数学基础，还是免费的！

宾夕法尼亚大学教授用1900页讲透了计算机科学数学基础，还是免费的！

算法与数据结构

51+阅读 · 2019年8月9日

你真的懂时间序列预测吗？

你真的懂时间序列预测吗？

腾讯大讲堂

104+阅读 · 2019年1月7日

利用动态深度学习预测金融时间序列基于Python

利用动态深度学习预测金融时间序列基于Python

量化投资与机器学习

18+阅读 · 2018年10月30日

时间卷积网络（TCN）将取代RNN成为NLP预测领域王者

时间卷积网络（TCN）将取代RNN成为NLP预测领域王者

AI前线

11+阅读 · 2018年5月14日

AWS 上可用的公用数据集，任何人都可以免费访问

AWS 上可用的公用数据集，任何人都可以免费访问

AI研习社

11+阅读 · 2018年4月2日

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

专知

23+阅读 · 2018年1月17日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

相关论文

Zero-Trust Bilateral Edge Service Trading with Deposit-Refund Regulation for Runtime Compliance

Arxiv

0+阅读 · 5月4日

FreeOcc: Training-Free Embodied Open-Vocabulary Occupancy Prediction

Arxiv

0+阅读 · 4月30日

Probing for Better Age of Information in Energy-Harvesting Random Access Networks

Arxiv

0+阅读 · 4月28日

Temporal Representations for Exploration: Learning Complex Exploratory Behavior without Extrinsic Rewards

Arxiv

0+阅读 · 4月19日

Time is Not a Label: Continuous Phase Rotation for Temporal Knowledge Graphs and Agentic Memory

Arxiv

0+阅读 · 4月13日

Physics-Informed Transformer for Real-Time High-Fidelity Topology Optimization

Arxiv

0+阅读 · 4月4日

Inversion-Free Natural Gradient Descent on Riemannian Manifolds

Arxiv

0+阅读 · 4月3日

Massive Redundancy in Gradient Transport Enables Sparse Online Learning

Arxiv

0+阅读 · 3月27日

Stabilizing a linear system using phone calls when time is information

Arxiv

0+阅读 · 3月27日

Compliance as a Trust Metric

Arxiv

0+阅读 · 3月24日

相关基金

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

卫星导航系统时间溯源新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

时空上下文感知的云服务质量预测和推荐的研究

国家自然科学基金

0+阅读 · 2015年12月31日

混沌时间序列Volterra建模及其在语音信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

云计算环境信任链系统安全性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

延迟容忍网络中自适应社会感知路由研究

国家自然科学基金

0+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

应用服务保障完成时限的网络传输机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态网络中信息传播时间的理论分析与跨层算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

离散时间马氏链的泛函不等式及遍历性

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员