Multivariate Species Sampling Models - 专知论文

会员服务 ·

0

结构 · 非参数 · 概率 · 离散 · 离散分布 ·

Multivariate Species Sampling Models

翻译：多元物种抽样模型

Beatrice Franzolini,Antonio Lijoi,Igor Prünster,Giovanni Rebaudo

Species sampling processes have long served as the fundamental framework for modeling random discrete distributions and exchangeable sequences. However, data arising from distinct but related sources require a broader notion of probabilistic invariance, making partial exchangeability a natural choice. Countless models for partially exchangeable data, collectively known as dependent nonparametric priors, have been proposed. These include hierarchical, nested and additive processes, widely used in statistics and machine learning. Still, a unifying framework is lacking and key questions about their underlying learning mechanisms remain unanswered. We fill this gap by introducing multivariate species sampling models, a new general class of nonparametric priors that encompasses most existing finite- and infinite-dimensional dependent processes. They are characterized by the induced partially exchangeable partition probability function encoding their multivariate clustering structure. We establish their core distributional properties and analyze their dependence structure, demonstrating that borrowing of information across groups is entirely determined by shared ties. This provides new insights into the underlying learning mechanisms, offering, for instance, a principled rationale for the previously unexplained correlation structure observed in existing models. Beyond providing a cohesive theoretical foundation, our approach serves as a constructive tool for developing new models and opens novel research directions for capturing richer dependence structures beyond the framework of multivariate species sampling processes.

翻译：物种抽样过程长期以来一直是建模随机离散分布与可交换序列的基础框架。然而，源于不同但相关来源的数据需要更广泛的概率不变性概念，使得部分可交换性成为自然选择。大量针对部分可交换数据的模型——统称为依赖非参数先验——已被提出，包括在统计学与机器学习中广泛使用的分层、嵌套与可加过程。尽管如此，目前仍缺乏一个统一框架，且关于其底层学习机制的关键问题尚未得到解答。我们通过引入多元物种抽样模型填补了这一空白，这是一个新的通用非参数先验类别，涵盖了大多数现有的有限维与无限维依赖过程。其特征由编码其多元聚类结构的诱导部分可交换划分概率函数所刻画。我们建立了其核心分布性质，并分析了其依赖结构，证明了跨组信息借用完全由共享关联决定。这为底层学习机制提供了新的见解，例如，为现有模型中观察到的先前无法解释的相关结构提供了原理性依据。除了提供统一的理论基础外，我们的方法还可作为开发新模型的构建工具，并为捕捉超越多元物种抽样过程框架的更丰富依赖结构开辟了新的研究方向。

0

相关内容

用于多模态对齐的基础模型表征潜力：一项综述

用于多模态对齐的基础模型表征潜力：一项综述

专知会员服务

18+阅读 · 2025年10月8日

【WWW2025】基于多模态图结构的专家混合变分网络—零样本多模态信息抽取方法

【WWW2025】基于多模态图结构的专家混合变分网络—零样本多模态信息抽取方法

专知会员服务

14+阅读 · 2025年3月31日

大规模多模态模型数据集、应用类别与分类学综述

大规模多模态模型数据集、应用类别与分类学综述

专知会员服务

58+阅读 · 2024年12月25日

【剑桥大学博士论文】推进归一化流模型以模拟玻尔兹曼分布，187页pdf

【剑桥大学博士论文】推进归一化流模型以模拟玻尔兹曼分布，187页pdf

专知会员服务

26+阅读 · 2024年8月22日

大模型如何做药物发现？Mila等30多位作者发布《基础模型分子学习: 大规模多任务数据集》

大模型如何做药物发现？Mila等30多位作者发布《基础模型分子学习: 大规模多任务数据集》

专知会员服务

28+阅读 · 2023年10月10日

2022最新《对抗领域中的对手建模综述》51页pdf，美国马萨诸塞大学，A Survey on Opponent Modeling in Adversarial Domains

2022最新《对抗领域中的对手建模综述》51页pdf，美国马萨诸塞大学，A Survey on Opponent Modeling in Adversarial Domains

专知会员服务

67+阅读 · 2022年4月15日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

复旦大学邱锡鹏等《自然语言处理范式迁移综述》论文，详述7大NLP范式：分类、匹配、SeqLab, MRC, Seq2Seq等

专知会员服务

54+阅读 · 2021年9月29日

【经典书】图模型: 指数族和变分推断，305页pdf

专知会员服务

52+阅读 · 2020年12月10日

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

专知会员服务

20+阅读 · 2020年4月25日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【ACL2020】多模态信息抽取，365页ppt全面阐述各种形式文本信息抽取

【ACL2020】多模态信息抽取，365页ppt全面阐述各种形式文本信息抽取

专知

31+阅读 · 2020年7月6日

赛尔笔记 | 多模态信息抽取简述

赛尔笔记 | 多模态信息抽取简述

专知

29+阅读 · 2020年4月12日

【工大SCIR笔记】多模态信息抽取简述

【工大SCIR笔记】多模态信息抽取简述

深度学习自然语言处理

19+阅读 · 2020年4月3日

技术动态 | 跨句多元关系抽取

技术动态 | 跨句多元关系抽取

开放知识图谱

50+阅读 · 2019年10月24日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

AINLP

15+阅读 · 2019年8月12日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

大讲堂 | 神经关系抽取模型

大讲堂 | 神经关系抽取模型

AI研习社

24+阅读 · 2018年9月11日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

随机图和随机环境中的接触过程、选举模型、排他过程

国家自然科学基金

0+阅读 · 2015年12月31日

抽样环境下基于流记录的行为特征分析与多分类器识别模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像的植物种类识别与植物三维建模

国家自然科学基金

3+阅读 · 2015年12月31日

基于Phase-type分布的多状态系统可靠性模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基因表达随机调控的数学模型及动态分析

国家自然科学基金

0+阅读 · 2015年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

基于多尺度分析的森林群落木本植物种-面积关系区域分异及其影响因素研究

国家自然科学基金

0+阅读 · 2014年12月31日

种群遗传学的多人交互式学习研究

国家自然科学基金

0+阅读 · 2014年12月31日

高维稀疏统计模型中的变量选择与检验

国家自然科学基金

1+阅读 · 2014年12月31日

Distributionally balanced sampling designs

Arxiv

0+阅读 · 3月12日

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Arxiv

0+阅读 · 3月12日

Relational Transformer: Toward Zero-Shot Foundation Models for Relational Data

Arxiv

0+阅读 · 3月2日

Conjugating Variational Inference for Large Mixed Multinomial Logit Models and Consumer Choice

Arxiv

0+阅读 · 2月19日

Modeling Multivariate Missingness with Tree Graphs and Conjugate Odds

Arxiv

0+阅读 · 2月19日

On integral priors for multiple comparison in Bayesian model selection

Arxiv

0+阅读 · 2月17日

Robust MultiSpecies Agricultural Segmentation Across Devices, Seasons, and Sensors Using Hierarchical DINOv2 Models

Arxiv

0+阅读 · 2月16日

Modelling multivariate ordinal time series using pairwise likelihood

Arxiv

0+阅读 · 2月13日

Conjugate Variational Inference for Large Mixed Multinomial Logit Models and Consumer Choice

Arxiv

0+阅读 · 2月13日

Theory of Speciation Transitions in Diffusion Models with General Class Structure

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

3+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

5+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

3+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

2+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

10+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

7+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

5+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

3+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

7+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

3+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

3+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

7+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

6+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

10+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

5+阅读 · 4月20日

相关VIP内容

用于多模态对齐的基础模型表征潜力：一项综述

用于多模态对齐的基础模型表征潜力：一项综述

专知会员服务

18+阅读 · 2025年10月8日

【WWW2025】基于多模态图结构的专家混合变分网络—零样本多模态信息抽取方法

【WWW2025】基于多模态图结构的专家混合变分网络—零样本多模态信息抽取方法

专知会员服务

14+阅读 · 2025年3月31日

大规模多模态模型数据集、应用类别与分类学综述

大规模多模态模型数据集、应用类别与分类学综述

专知会员服务

58+阅读 · 2024年12月25日

【剑桥大学博士论文】推进归一化流模型以模拟玻尔兹曼分布，187页pdf

【剑桥大学博士论文】推进归一化流模型以模拟玻尔兹曼分布，187页pdf

专知会员服务

26+阅读 · 2024年8月22日

大模型如何做药物发现？Mila等30多位作者发布《基础模型分子学习: 大规模多任务数据集》

大模型如何做药物发现？Mila等30多位作者发布《基础模型分子学习: 大规模多任务数据集》

专知会员服务

28+阅读 · 2023年10月10日

2022最新《对抗领域中的对手建模综述》51页pdf，美国马萨诸塞大学，A Survey on Opponent Modeling in Adversarial Domains

2022最新《对抗领域中的对手建模综述》51页pdf，美国马萨诸塞大学，A Survey on Opponent Modeling in Adversarial Domains

专知会员服务

67+阅读 · 2022年4月15日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

复旦大学邱锡鹏等《自然语言处理范式迁移综述》论文，详述7大NLP范式：分类、匹配、SeqLab, MRC, Seq2Seq等

专知会员服务

54+阅读 · 2021年9月29日

【经典书】图模型: 指数族和变分推断，305页pdf

专知会员服务

52+阅读 · 2020年12月10日

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

专知会员服务

20+阅读 · 2020年4月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【ACL2020】多模态信息抽取，365页ppt全面阐述各种形式文本信息抽取

【ACL2020】多模态信息抽取，365页ppt全面阐述各种形式文本信息抽取

专知

31+阅读 · 2020年7月6日

赛尔笔记 | 多模态信息抽取简述

赛尔笔记 | 多模态信息抽取简述

专知

29+阅读 · 2020年4月12日

【工大SCIR笔记】多模态信息抽取简述

【工大SCIR笔记】多模态信息抽取简述

深度学习自然语言处理

19+阅读 · 2020年4月3日

技术动态 | 跨句多元关系抽取

技术动态 | 跨句多元关系抽取

开放知识图谱

50+阅读 · 2019年10月24日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

AINLP

15+阅读 · 2019年8月12日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

大讲堂 | 神经关系抽取模型

大讲堂 | 神经关系抽取模型

AI研习社

24+阅读 · 2018年9月11日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

相关论文

Distributionally balanced sampling designs

Arxiv

0+阅读 · 3月12日

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Arxiv

0+阅读 · 3月12日

Relational Transformer: Toward Zero-Shot Foundation Models for Relational Data

Arxiv

0+阅读 · 3月2日

Conjugating Variational Inference for Large Mixed Multinomial Logit Models and Consumer Choice

Arxiv

0+阅读 · 2月19日

Modeling Multivariate Missingness with Tree Graphs and Conjugate Odds

Arxiv

0+阅读 · 2月19日

On integral priors for multiple comparison in Bayesian model selection

Arxiv

0+阅读 · 2月17日

Robust MultiSpecies Agricultural Segmentation Across Devices, Seasons, and Sensors Using Hierarchical DINOv2 Models

Arxiv

0+阅读 · 2月16日

Modelling multivariate ordinal time series using pairwise likelihood

Arxiv

0+阅读 · 2月13日

Conjugate Variational Inference for Large Mixed Multinomial Logit Models and Consumer Choice

Arxiv

0+阅读 · 2月13日

Theory of Speciation Transitions in Diffusion Models with General Class Structure

Arxiv

0+阅读 · 2月4日

相关基金

随机图和随机环境中的接触过程、选举模型、排他过程

国家自然科学基金

0+阅读 · 2015年12月31日

抽样环境下基于流记录的行为特征分析与多分类器识别模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像的植物种类识别与植物三维建模

国家自然科学基金

3+阅读 · 2015年12月31日

基于Phase-type分布的多状态系统可靠性模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基因表达随机调控的数学模型及动态分析

国家自然科学基金

0+阅读 · 2015年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

基于多尺度分析的森林群落木本植物种-面积关系区域分异及其影响因素研究

国家自然科学基金

0+阅读 · 2014年12月31日

种群遗传学的多人交互式学习研究

国家自然科学基金

0+阅读 · 2014年12月31日

高维稀疏统计模型中的变量选择与检验

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员