Uncertainty-driven Embedding Convolution - 专知论文

会员服务 ·

0

嵌入 · 不确定 · 不确定性 · 卷积 · 集成 ·

Uncertainty-driven Embedding Convolution

翻译：不确定性驱动的嵌入卷积

Sungjun Lim,Kangjun Noh,Youngjun Choi,Heeyoung Lee,Kyungwoo Song

Text embeddings are essential components in modern NLP pipelines. Although numerous embedding models have been proposed, no single model consistently dominates across domains and tasks. This variability motivates the use of ensemble techniques to combine complementary strengths. However, most existing ensemble methods operate on deterministic embeddings and fail to account for model-specific uncertainty, limiting their robustness and reliability in downstream applications. To address these limitations, we propose Uncertainty-driven Embedding Convolution (UEC). UEC first transforms deterministic embeddings into probabilistic ones in a post-hoc manner. It then computes adaptive ensemble coefficients based on embedding uncertainty, derived from a principled surrogate-loss formulation. Additionally, UEC employs an uncertainty-aware similarity function that directly incorporates uncertainty into the similarity scoring, providing a theoretically grounded and efficient surrogate to distributional distances. Extensive experiments on diverse benchmarks demonstrate that UEC consistently improves both performance and robustness by leveraging principled uncertainty modeling.

翻译：文本嵌入是现代自然语言处理流程中的核心组件。尽管已有众多嵌入模型被提出，但尚无单一模型能够在所有领域和任务中始终保持最优性能。这种性能差异促使研究者采用集成技术来结合不同模型的互补优势。然而，现有的大多数集成方法仅处理确定性嵌入，未能考虑模型特定的不确定性，这限制了其在下游应用中的鲁棒性和可靠性。为克服这些局限性，本文提出不确定性驱动的嵌入卷积方法。该方法首先以后处理方式将确定性嵌入转换为概率化嵌入，随后基于嵌入不确定性（通过理论替代损失公式推导得出）计算自适应集成系数。此外，UEC采用不确定性感知的相似度函数，将不确定性直接纳入相似性评分过程，为分布距离提供了理论完备且计算高效的替代方案。在多样化基准测试上的大量实验表明，通过采用理论驱动的不确定性建模，UEC能够持续提升模型性能与鲁棒性。

0

相关内容

【EPFL博士论文】现代深度学习中的不确定性建模，169页pdf

【EPFL博士论文】现代深度学习中的不确定性建模，169页pdf

专知会员服务

26+阅读 · 2025年5月15日

【博士论文】自然语言处理不确定估计

【博士论文】自然语言处理不确定估计

专知会员服务

24+阅读 · 2024年5月22日

【ETHZ博士论文】分布不确定性下的决策，234页pdf

【ETHZ博士论文】分布不确定性下的决策，234页pdf

专知会员服务

49+阅读 · 2024年4月5日

大模型如何统一生成和嵌入？最新《生成式表示指令微调》论文详细解答

大模型如何统一生成和嵌入？最新《生成式表示指令微调》论文详细解答

专知会员服务

44+阅读 · 2024年2月18日

【阿姆斯特丹博士论文】深度学习中不确定性与压缩的概率推理，155页pdf

【阿姆斯特丹博士论文】深度学习中不确定性与压缩的概率推理，155页pdf

专知会员服务

68+阅读 · 2023年3月24日

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

专知会员服务

190+阅读 · 2020年4月4日

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

专知会员服务

39+阅读 · 2020年3月23日

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

专知会员服务

42+阅读 · 2020年3月17日

【WSDM 2020 论文】网络嵌入的初始化：一种图划分方法（Initialization for Network Embedding: A Graph Partition Approach）

【WSDM 2020 论文】网络嵌入的初始化：一种图划分方法（Initialization for Network Embedding: A Graph Partition Approach）

专知会员服务

44+阅读 · 2019年11月20日

【AAAI2020接受论文】利用图卷积网络将知识注入文本任务，Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

【AAAI2020接受论文】利用图卷积网络将知识注入文本任务，Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

专知会员服务

45+阅读 · 2019年11月11日

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

37+阅读 · 2020年6月17日

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

专知

23+阅读 · 2020年4月4日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

图嵌入（Graph embedding）综述

图嵌入（Graph embedding）综述

人工智能前沿讲习班

449+阅读 · 2019年4月30日

总结-空洞卷积(Dilated/Atrous Convolution)

总结-空洞卷积(Dilated/Atrous Convolution)

极市平台

41+阅读 · 2019年2月25日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

什么是深度学习的卷积？

什么是深度学习的卷积？

论智

18+阅读 · 2018年8月14日

Word2Vec与Glove：词嵌入方法的动机和直觉

Word2Vec与Glove：词嵌入方法的动机和直觉

论智

14+阅读 · 2018年6月23日

干货｜当深度学习遇见自动文本摘要，seq2seq+attention

干货｜当深度学习遇见自动文本摘要，seq2seq+attention

机器学习算法与Python学习

10+阅读 · 2018年5月28日

深度学习 | 利用词嵌入对文本进行情感分析

深度学习 | 利用词嵌入对文本进行情感分析

沈浩老师

11+阅读 · 2017年10月19日

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

计及多重-复合不确定性的电力系统稳定约束优化调度研究

国家自然科学基金

1+阅读 · 2016年12月31日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式存储器容错设计关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

分形几何中的嵌入问题

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

Interpreting Contrastive Embeddings in Specific Domains with Fuzzy Rules

Arxiv

0+阅读 · 3月12日

Bootstrapping Embeddings for Low Resource Languages

Arxiv

0+阅读 · 3月2日

Uncertainty Quantification for Multimodal Large Language Models with Incoherence-adjusted Semantic Volume

Arxiv

0+阅读 · 2月27日

Uncertainty Estimation by Flexible Evidential Deep Learning

Arxiv

0+阅读 · 2月20日

Embed-RL: Reinforcement Learning for Reasoning-Driven Multimodal Embeddings

Arxiv

0+阅读 · 2月14日

Uncertainty-aware Generative Recommendation

Arxiv

0+阅读 · 2月12日

Bagging-Based Model Merging for Robust General Text Embeddings

Arxiv

0+阅读 · 2月9日

A Parameterizable Convolution Accelerator for Embedded Deep Learning Applications

Arxiv

0+阅读 · 2月3日

Uncertainty-driven Adaptive Exploration

Arxiv

0+阅读 · 2月3日

Embedding Perturbation may Better Reflect the Uncertainty in LLM Reasoning

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

0+阅读 · 今天13:13

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

0+阅读 · 今天13:08

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

3+阅读 · 今天7:11

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

5+阅读 · 今天6:56

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

2+阅读 · 今天4:16

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

10+阅读 · 今天3:36

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

4+阅读 · 今天3:21

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

6+阅读 · 今天3:13

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 今天2:55

《基于Transformer的异常舰船导航识别与跟踪》80页

《基于Transformer的异常舰船导航识别与跟踪》80页

专知会员服务

8+阅读 · 今天2:45

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

专知会员服务

6+阅读 · 今天2:41

《低数据领域军事目标检测模型研究》

《低数据领域军事目标检测模型研究》

专知会员服务

6+阅读 · 今天2:37

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

专知会员服务

6+阅读 · 今天2:32

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

10+阅读 · 4月22日

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

18+阅读 · 4月22日

相关VIP内容

【EPFL博士论文】现代深度学习中的不确定性建模，169页pdf

【EPFL博士论文】现代深度学习中的不确定性建模，169页pdf

专知会员服务

26+阅读 · 2025年5月15日

【博士论文】自然语言处理不确定估计

【博士论文】自然语言处理不确定估计

专知会员服务

24+阅读 · 2024年5月22日

【ETHZ博士论文】分布不确定性下的决策，234页pdf

【ETHZ博士论文】分布不确定性下的决策，234页pdf

专知会员服务

49+阅读 · 2024年4月5日

大模型如何统一生成和嵌入？最新《生成式表示指令微调》论文详细解答

大模型如何统一生成和嵌入？最新《生成式表示指令微调》论文详细解答

专知会员服务

44+阅读 · 2024年2月18日

【阿姆斯特丹博士论文】深度学习中不确定性与压缩的概率推理，155页pdf

【阿姆斯特丹博士论文】深度学习中不确定性与压缩的概率推理，155页pdf

专知会员服务

68+阅读 · 2023年3月24日

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

专知会员服务

190+阅读 · 2020年4月4日

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

临床自然语言处理中的嵌入综述，SECNLP: A survey of embeddings

专知会员服务

39+阅读 · 2020年3月23日

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

【牛津大学-DeepMind 】上下文嵌入综述，A Survey on Contextual Embeddings

专知会员服务

42+阅读 · 2020年3月17日

【WSDM 2020 论文】网络嵌入的初始化：一种图划分方法（Initialization for Network Embedding: A Graph Partition Approach）

【WSDM 2020 论文】网络嵌入的初始化：一种图划分方法（Initialization for Network Embedding: A Graph Partition Approach）

专知会员服务

44+阅读 · 2019年11月20日

【AAAI2020接受论文】利用图卷积网络将知识注入文本任务，Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

【AAAI2020接受论文】利用图卷积网络将知识注入文本任务，Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

专知会员服务

45+阅读 · 2019年11月11日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体长期记忆安全性综述：迈向记忆主权

人工智能赋能无人机：俄乌战争（万字长文）

【斯坦福博士论文】语言模型的机械可解释性与控制

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

相关资讯

最新《动态网络嵌入》综述论文，25页pdf

最新《动态网络嵌入》综述论文，25页pdf

专知

37+阅读 · 2020年6月17日

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

【新书】自然语言处理嵌入：语义向量表示理论与进展，从Word2Vec到BERT，163页pdf

专知

23+阅读 · 2020年4月4日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

图嵌入（Graph embedding）综述

图嵌入（Graph embedding）综述

人工智能前沿讲习班

449+阅读 · 2019年4月30日

总结-空洞卷积(Dilated/Atrous Convolution)

总结-空洞卷积(Dilated/Atrous Convolution)

极市平台

41+阅读 · 2019年2月25日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

什么是深度学习的卷积？

什么是深度学习的卷积？

论智

18+阅读 · 2018年8月14日

Word2Vec与Glove：词嵌入方法的动机和直觉

Word2Vec与Glove：词嵌入方法的动机和直觉

论智

14+阅读 · 2018年6月23日

干货｜当深度学习遇见自动文本摘要，seq2seq+attention

干货｜当深度学习遇见自动文本摘要，seq2seq+attention

机器学习算法与Python学习

10+阅读 · 2018年5月28日

深度学习 | 利用词嵌入对文本进行情感分析

深度学习 | 利用词嵌入对文本进行情感分析

沈浩老师

11+阅读 · 2017年10月19日

相关论文

Interpreting Contrastive Embeddings in Specific Domains with Fuzzy Rules

Arxiv

0+阅读 · 3月12日

Bootstrapping Embeddings for Low Resource Languages

Arxiv

0+阅读 · 3月2日

Uncertainty Quantification for Multimodal Large Language Models with Incoherence-adjusted Semantic Volume

Arxiv

0+阅读 · 2月27日

Uncertainty Estimation by Flexible Evidential Deep Learning

Arxiv

0+阅读 · 2月20日

Embed-RL: Reinforcement Learning for Reasoning-Driven Multimodal Embeddings

Arxiv

0+阅读 · 2月14日

Uncertainty-aware Generative Recommendation

Arxiv

0+阅读 · 2月12日

Bagging-Based Model Merging for Robust General Text Embeddings

Arxiv

0+阅读 · 2月9日

A Parameterizable Convolution Accelerator for Embedded Deep Learning Applications

Arxiv

0+阅读 · 2月3日

Uncertainty-driven Adaptive Exploration

Arxiv

0+阅读 · 2月3日

Embedding Perturbation may Better Reflect the Uncertainty in LLM Reasoning

Arxiv

0+阅读 · 2月2日

相关基金

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

计及多重-复合不确定性的电力系统稳定约束优化调度研究

国家自然科学基金

1+阅读 · 2016年12月31日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式存储器容错设计关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

分形几何中的嵌入问题

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员