In ecology, the description of species composition and biodiversity calls for statistical methods that involve estimating features of interest in unobserved samples based on an observed one. In the last decade, the Bayesian nonparametrics literature has thoroughly investigated the case where data arise from a homogeneous population. In this work, we propose a novel framework to address heterogeneous populations, specifically dealing with scenarios where data arise from two areas. This setting significantly increases the mathematical complexity of the problem and, as a consequence, it has received limited attention in the literature. While early approaches leverage computational methods, we provide a distributional theory for the in-sample analysis of any observed sample and enable out-of-sample prediction for the number of unseen distinct and shared species in additional samples of arbitrary sizes. The latter also extends the frequentist estimators, which solely deal with one-step-ahead prediction. Furthermore, our results can be applied to address sample size determination in sampling problems aimed at detecting distinct and shared species. Our results are illustrated in a real-world dataset concerning a population of ants in the city of Trieste.


翻译:在生态学中,对物种组成和生物多样性的描述需要借助统计方法,这些方法基于观测到的样本估计未观测样本中的感兴趣特征。过去十年中,贝叶斯非参数文献已深入研究了数据来自同质总体的情况。本研究提出一个新颖框架以应对异质总体,特别是处理数据来自两个区域的场景。这一设定显著增加了问题的数学复杂性,因此该方向在文献中受到的关注有限。早期方法多依赖计算技术,而我们则提供了任何观测样本的样本内分析分布理论,并能够对任意规模额外样本中未观测到的独特物种和共有物种数量进行样本外预测。后者还扩展了仅处理单步预测的频率派估计量。此外,我们的结果可应用于旨在检测独特物种和共有物种的抽样问题中的样本量确定。我们在意大利的里雅斯特市蚂蚁种群的真实数据集中展示了研究结果。

0
下载
关闭预览

相关内容

开放环境下的跨域物体检测综述
专知会员服务
26+阅读 · 2024年5月27日
【AAAI2022】跨域少样本图分类
专知会员服务
30+阅读 · 2022年1月22日
【Nature】贝叶斯统计与建模综述,26页pdf
专知会员服务
77+阅读 · 2021年1月21日
Galaxy Zoo:利用众包和主动学习对星系进行分类
TensorFlow
16+阅读 · 2020年6月22日
非平衡数据集 focal loss 多类分类
AI研习社
33+阅读 · 2019年4月23日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
异常检测的阈值,你怎么选?给你整理好了...
机器学习算法与Python学习
10+阅读 · 2018年9月19日
统计学常用数据类型
论智
19+阅读 · 2018年7月6日
贝叶斯机器学习前沿进展
机器学习研究会
21+阅读 · 2018年1月21日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月9日
VIP会员
相关主题
最新内容
重新思考无人机时代的生存能力
专知会员服务
2+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
2+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
3+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
3+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关VIP内容
开放环境下的跨域物体检测综述
专知会员服务
26+阅读 · 2024年5月27日
【AAAI2022】跨域少样本图分类
专知会员服务
30+阅读 · 2022年1月22日
【Nature】贝叶斯统计与建模综述,26页pdf
专知会员服务
77+阅读 · 2021年1月21日
相关资讯
Galaxy Zoo:利用众包和主动学习对星系进行分类
TensorFlow
16+阅读 · 2020年6月22日
非平衡数据集 focal loss 多类分类
AI研习社
33+阅读 · 2019年4月23日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
异常检测的阈值,你怎么选?给你整理好了...
机器学习算法与Python学习
10+阅读 · 2018年9月19日
统计学常用数据类型
论智
19+阅读 · 2018年7月6日
贝叶斯机器学习前沿进展
机器学习研究会
21+阅读 · 2018年1月21日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员