【博士论文】深度序列模型中的概率学习与生成机制 - 专知VIP

会员服务 ·

5

深度序列模型 · 博士论文 · 概念学习 · 归纳偏置 ·

【博士论文】深度序列模型中的概率学习与生成机制

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度序列模型在广泛的数据模态中取得了巨大的成功。尽管其预测性能卓越，但部署中的主要担忧集中在不确定性感知（uncertainty awareness）的缺失。相比之下，概率模型通过概率法则量化与未观测变量相关的不确定性。值得注意的是，贝叶斯方法利用贝叶斯法则，以原则性（principled）的方式表达在给定观测变量下对未观测变量的信念。由于精确的贝叶斯推断在大规模计算上是不可行的，实践中通常需要近似推断（approximate inference）。贝叶斯方法（特别是应用于深度神经网络时）的两大瓶颈在于先验指定（prior specification）和近似质量。在第三章和第四章中，我们研究了深度序列模型本身的架构如何为概率模型中的先验指定或近似方法选择提供信息。 1. 首先，基于**注意力机制（attention mechanism）与稀疏高斯过程（sparse Gaussian process）**之间的相似性，我们开发了一种专为 Transformer 架构定制的近似贝叶斯推断方法。 1. 其次，我们利用 HiPPOs（高阶多项式投影算子）的长程记忆保持能力，为高斯过程构建了一个跨域诱导点（interdomain inducing point），从而在在线学习或持续学习中成功实现了对历史信息的记忆。

除了深度序列模型在预测任务中的进展外，由一系列隐变量构成的序列生成模型（如扩散模型）在深度生成模型领域也得到了普及。受扩散模型中这些隐变量具备显式自监督信号的启发，在第五章中，我们探索了利用隐状态自监督信号改进其他深度生成模型的可能性，并研究了序列生成中隐状态序列所需的概率结构。总体而言，本论文利用深度序列模型中的**归纳偏置（inductive biases）**来设计概率推断或结构，桥接了深度序列模型与概率模型之间的鸿沟，实现了双向的增强与改进。

成为VIP会员查看完整内容

13

相关内容

深度序列模型

深度序列模型

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

专知会员服务

24+阅读 · 2025年1月15日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

39+阅读 · 2024年6月22日

【剑桥大学博士论文】概率深度学习的进展及其应用, 207页pdf

【剑桥大学博士论文】概率深度学习的进展及其应用, 207页pdf

专知会员服务

55+阅读 · 2024年1月11日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知会员服务

67+阅读 · 2022年11月30日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

深度生成模型综述

深度生成模型综述

专知会员服务

52+阅读 · 2022年1月2日

康奈尔大学「深度概率与生成模型」2021SP课程

专知会员服务

49+阅读 · 2021年4月24日

【博士论文】面向文本生成的深度序列模型研究

专知会员服务

56+阅读 · 2020年12月20日

最新【深度生成模型】Deep Generative Models，104页ppt

最新【深度生成模型】Deep Generative Models，104页ppt

专知会员服务

71+阅读 · 2020年10月24日

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

专知会员服务

52+阅读 · 2019年11月8日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

10+阅读 · 2022年1月16日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

LibRec智能推荐

41+阅读 · 2019年5月9日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

一文读懂机器学习概率图模型（附示例&学习资源）

一文读懂机器学习概率图模型（附示例&学习资源）

数据派THU

47+阅读 · 2017年12月10日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

生物序列大数据集模体发现算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Arxiv

0+阅读 · 3月12日

Probabilistic Retrofitting of Learned Simulators

Arxiv

0+阅读 · 3月2日

Probabilistic Learning and Generation in Deep Sequence Models

Arxiv

0+阅读 · 3月1日

On the Equivalence of Random Network Distillation, Deep Ensembles, and Bayesian Inference

Arxiv

0+阅读 · 2月26日

Deep Generative model that uses physical quantities to generate and retrieve solar magnetic active regions

Arxiv

0+阅读 · 2月20日

Uncertainty Estimation by Flexible Evidential Deep Learning

Arxiv

0+阅读 · 2月20日

Scaling Laws for Uncertainty in Deep Learning

Arxiv

0+阅读 · 2月9日

Deep Ensembles for Epistemic Uncertainty: A Frequentist Perspective

Arxiv

0+阅读 · 2月8日

Generative quantum machine learning via denoising diffusion probabilistic models

Arxiv

0+阅读 · 1月30日

Deep Ensembles for Epistemic Uncertainty: A Frequentist Perspective

Arxiv

0+阅读 · 1月30日

VIP会员

相关主题

深度序列模型

最新内容

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

0+阅读 · 今天14:41

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

2+阅读 · 今天14:37

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

2+阅读 · 今天14:13

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

2+阅读 · 今天14:11

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

2+阅读 · 今天14:05

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

1+阅读 · 今天13:23

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

1+阅读 · 今天13:11

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

7+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

8+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

11+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

9+阅读 · 7月18日

相关VIP内容

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

专知会员服务

24+阅读 · 2025年1月15日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

39+阅读 · 2024年6月22日

【剑桥大学博士论文】概率深度学习的进展及其应用, 207页pdf

【剑桥大学博士论文】概率深度学习的进展及其应用, 207页pdf

专知会员服务

55+阅读 · 2024年1月11日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知会员服务

67+阅读 · 2022年11月30日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

深度生成模型综述

深度生成模型综述

专知会员服务

52+阅读 · 2022年1月2日

康奈尔大学「深度概率与生成模型」2021SP课程

专知会员服务

49+阅读 · 2021年4月24日

【博士论文】面向文本生成的深度序列模型研究

专知会员服务

56+阅读 · 2020年12月20日

最新【深度生成模型】Deep Generative Models，104页ppt

最新【深度生成模型】Deep Generative Models，104页ppt

专知会员服务

71+阅读 · 2020年10月24日

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

专知会员服务

52+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

印度精确打击与指挥架构的断层

美空军AI完成F-16战斗机自主空战历史性试飞

相关资讯

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

10+阅读 · 2022年1月16日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

LibRec智能推荐

41+阅读 · 2019年5月9日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

一文读懂机器学习概率图模型（附示例&学习资源）

一文读懂机器学习概率图模型（附示例&学习资源）

数据派THU

47+阅读 · 2017年12月10日

相关基金

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

生物序列大数据集模体发现算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

相关论文

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Arxiv

0+阅读 · 3月12日

Probabilistic Retrofitting of Learned Simulators

Arxiv

0+阅读 · 3月2日

Probabilistic Learning and Generation in Deep Sequence Models

Arxiv

0+阅读 · 3月1日

On the Equivalence of Random Network Distillation, Deep Ensembles, and Bayesian Inference

Arxiv

0+阅读 · 2月26日

Deep Generative model that uses physical quantities to generate and retrieve solar magnetic active regions

Arxiv

0+阅读 · 2月20日

Uncertainty Estimation by Flexible Evidential Deep Learning

Arxiv

0+阅读 · 2月20日

Scaling Laws for Uncertainty in Deep Learning

Arxiv

0+阅读 · 2月9日

Deep Ensembles for Epistemic Uncertainty: A Frequentist Perspective

Arxiv

0+阅读 · 2月8日

Generative quantum machine learning via denoising diffusion probabilistic models

Arxiv

0+阅读 · 1月30日

Deep Ensembles for Epistemic Uncertainty: A Frequentist Perspective

Arxiv

0+阅读 · 1月30日

微信扫码咨询专知VIP会员