【博士论文】深度序列模型中的概率学习与生成机制 - 专知VIP

会员服务 ·

2

深度序列模型 · 博士论文 · 概念学习 · 归纳偏置 ·

【博士论文】深度序列模型中的概率学习与生成机制

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度序列模型在广泛的数据模态中取得了巨大的成功。尽管其预测性能卓越，但部署中的主要担忧集中在不确定性感知（uncertainty awareness）的缺失。相比之下，概率模型通过概率法则量化与未观测变量相关的不确定性。值得注意的是，贝叶斯方法利用贝叶斯法则，以原则性（principled）的方式表达在给定观测变量下对未观测变量的信念。由于精确的贝叶斯推断在大规模计算上是不可行的，实践中通常需要近似推断（approximate inference）。贝叶斯方法（特别是应用于深度神经网络时）的两大瓶颈在于先验指定（prior specification）和近似质量。在第三章和第四章中，我们研究了深度序列模型本身的架构如何为概率模型中的先验指定或近似方法选择提供信息。 1. 首先，基于**注意力机制（attention mechanism）与稀疏高斯过程（sparse Gaussian process）**之间的相似性，我们开发了一种专为 Transformer 架构定制的近似贝叶斯推断方法。 1. 其次，我们利用 HiPPOs（高阶多项式投影算子）的长程记忆保持能力，为高斯过程构建了一个跨域诱导点（interdomain inducing point），从而在在线学习或持续学习中成功实现了对历史信息的记忆。

除了深度序列模型在预测任务中的进展外，由一系列隐变量构成的序列生成模型（如扩散模型）在深度生成模型领域也得到了普及。受扩散模型中这些隐变量具备显式自监督信号的启发，在第五章中，我们探索了利用隐状态自监督信号改进其他深度生成模型的可能性，并研究了序列生成中隐状态序列所需的概率结构。总体而言，本论文利用深度序列模型中的**归纳偏置（inductive biases）**来设计概率推断或结构，桥接了深度序列模型与概率模型之间的鸿沟，实现了双向的增强与改进。

成为VIP会员查看完整内容

3

相关内容

深度序列模型

深度序列模型

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

专知会员服务

24+阅读 · 2025年1月15日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

38+阅读 · 2024年6月22日

【剑桥大学博士论文】概率深度学习的进展及其应用, 207页pdf

【剑桥大学博士论文】概率深度学习的进展及其应用, 207页pdf

专知会员服务

55+阅读 · 2024年1月11日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知会员服务

66+阅读 · 2022年11月30日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

深度生成模型综述

深度生成模型综述

专知会员服务

52+阅读 · 2022年1月2日

康奈尔大学「深度概率与生成模型」2021SP课程

专知会员服务

49+阅读 · 2021年4月24日

【博士论文】面向文本生成的深度序列模型研究

专知会员服务

56+阅读 · 2020年12月20日

最新【深度生成模型】Deep Generative Models，104页ppt

最新【深度生成模型】Deep Generative Models，104页ppt

专知会员服务

71+阅读 · 2020年10月24日

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

专知会员服务

49+阅读 · 2019年11月8日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

10+阅读 · 2022年1月16日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

LibRec智能推荐

41+阅读 · 2019年5月9日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

一文读懂机器学习概率图模型（附示例&学习资源）

一文读懂机器学习概率图模型（附示例&学习资源）

数据派THU

47+阅读 · 2017年12月10日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

生物序列大数据集模体发现算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

A Review of Bayesian Uncertainty Quantification in Deep Probabilistic Image Segmentation

Arxiv

0+阅读 · 2月18日

Exposing Diversity Bias in Deep Generative Models: Statistical Origins and Correction of Diversity Error

Arxiv

0+阅读 · 2月16日

Tight Efficiency Bounds for the Probabilistic Serial and Related Mechanisms

Arxiv

0+阅读 · 2月12日

Scaling Laws for Uncertainty in Deep Learning

Arxiv

0+阅读 · 2月9日

Provable FDR Control for Deep Feature Selection: Deep MLPs and Beyond

Arxiv

0+阅读 · 2月9日

Deep Ensembles for Epistemic Uncertainty: A Frequentist Perspective

Arxiv

0+阅读 · 2月8日

Generative quantum machine learning via denoising diffusion probabilistic models

Arxiv

0+阅读 · 1月30日

Deep Ensembles for Epistemic Uncertainty: A Frequentist Perspective

Arxiv

0+阅读 · 1月30日

Quantum latent distributions in deep generative models

Arxiv

0+阅读 · 1月30日

Making Foundation Models Probabilistic via Singular Value Ensembles

Arxiv

0+阅读 · 1月29日

VIP会员

相关主题

深度序列模型

相关VIP内容

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

专知会员服务

24+阅读 · 2025年1月15日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

38+阅读 · 2024年6月22日

【剑桥大学博士论文】概率深度学习的进展及其应用, 207页pdf

【剑桥大学博士论文】概率深度学习的进展及其应用, 207页pdf

专知会员服务

55+阅读 · 2024年1月11日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知会员服务

66+阅读 · 2022年11月30日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

深度生成模型综述

深度生成模型综述

专知会员服务

52+阅读 · 2022年1月2日

康奈尔大学「深度概率与生成模型」2021SP课程

专知会员服务

49+阅读 · 2021年4月24日

【博士论文】面向文本生成的深度序列模型研究

专知会员服务

56+阅读 · 2020年12月20日

最新【深度生成模型】Deep Generative Models，104页ppt

最新【深度生成模型】Deep Generative Models，104页ppt

专知会员服务

71+阅读 · 2020年10月24日

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

专知会员服务

49+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】推断工程，Inference Engineering,259页pdf

伊朗称向以色列防空系统发射具备高超音速能力的“海巴尔”导弹

【博士论文】深度序列模型中的概率学习与生成机制

哈佛最新《面向系统设计的生成式 AI：从软件到硅片的重复性挑战与设计原则》

相关资讯

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

10+阅读 · 2022年1月16日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

LibRec智能推荐

41+阅读 · 2019年5月9日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

一文读懂机器学习概率图模型（附示例&学习资源）

一文读懂机器学习概率图模型（附示例&学习资源）

数据派THU

47+阅读 · 2017年12月10日

相关基金

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

生物序列大数据集模体发现算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

相关论文

A Review of Bayesian Uncertainty Quantification in Deep Probabilistic Image Segmentation

Arxiv

0+阅读 · 2月18日

Exposing Diversity Bias in Deep Generative Models: Statistical Origins and Correction of Diversity Error

Arxiv

0+阅读 · 2月16日

Tight Efficiency Bounds for the Probabilistic Serial and Related Mechanisms

Arxiv

0+阅读 · 2月12日

Scaling Laws for Uncertainty in Deep Learning

Arxiv

0+阅读 · 2月9日

Provable FDR Control for Deep Feature Selection: Deep MLPs and Beyond

Arxiv

0+阅读 · 2月9日

Deep Ensembles for Epistemic Uncertainty: A Frequentist Perspective

Arxiv

0+阅读 · 2月8日

Generative quantum machine learning via denoising diffusion probabilistic models

Arxiv

0+阅读 · 1月30日

Deep Ensembles for Epistemic Uncertainty: A Frequentist Perspective

Arxiv

0+阅读 · 1月30日

Quantum latent distributions in deep generative models

Arxiv

0+阅读 · 1月30日

Making Foundation Models Probabilistic via Singular Value Ensembles

Arxiv

0+阅读 · 1月29日

微信扫码咨询专知VIP会员