The integration of data from multiple sources is increasingly used to achieve larger sample sizes and enhance population diversity. Our previous work established that, under random sampling from the same underlying population, integrating large incomplete datasets with summary-level data produces unbiased parameter estimates. In this study, we develop a novel statistical framework that enables the integration of summary-level data with information from heterogeneous data sources by leveraging auxiliary information. The proposed approach estimates study-specific sampling weights using this auxiliary information and calibrates the estimating equations to obtain the full set of model parameters. We evaluate the performance of the proposed method through simulation studies under various sampling designs and illustrate its application by reanalyzing U.S. cancer registry data combined with summary-level odds ratio estimates for selected colorectal cancer (CRC) risk factors, while relaxing the random sampling assumption.


翻译:整合多源数据以扩大样本规模并增强人群多样性的做法日益普遍。我们先前的研究已证实,在从同一基础人群中进行随机抽样的前提下,将大规模不完整数据集与汇总数据相结合能够产生无偏的参数估计。本研究提出了一种新颖的统计框架,通过利用辅助信息实现汇总数据与异构数据源信息的整合。该方法借助辅助信息估计特定研究的抽样权重,并校准估计方程以获得完整的模型参数集。我们通过多种抽样设计下的模拟研究评估了所提方法的性能,并通过重新分析美国癌症登记数据(结合选定结直肠癌风险因素的汇总水平比值比估计)展示了其应用,同时放宽了随机抽样假设。

0
下载
关闭预览

相关内容

《多模态数据融合驱动系统改进:研究综述(美空军)》
干货书《数据融合:理论、方法和应用》289页
专知会员服务
130+阅读 · 2023年4月2日
异质信息网络分析与应用综述,软件学报-北京邮电大学
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
302+阅读 · 2020年6月16日
【国防科大】复杂异构数据的表征学习综述
专知会员服务
85+阅读 · 2020年4月23日
数据受限条件下的多模态处理技术综述
专知
22+阅读 · 2022年7月16日
基于深度学习的数据融合方法研究综述
专知
37+阅读 · 2020年12月10日
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
讲堂|郑宇:多源数据融合与时空数据挖掘(下)
微软研究院AI头条
18+阅读 · 2017年4月18日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Arxiv
0+阅读 · 1月12日
Arxiv
95+阅读 · 2022年8月2日
VIP会员
相关VIP内容
《多模态数据融合驱动系统改进:研究综述(美空军)》
干货书《数据融合:理论、方法和应用》289页
专知会员服务
130+阅读 · 2023年4月2日
异质信息网络分析与应用综述,软件学报-北京邮电大学
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
302+阅读 · 2020年6月16日
【国防科大】复杂异构数据的表征学习综述
专知会员服务
85+阅读 · 2020年4月23日
相关资讯
数据受限条件下的多模态处理技术综述
专知
22+阅读 · 2022年7月16日
基于深度学习的数据融合方法研究综述
专知
37+阅读 · 2020年12月10日
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
讲堂|郑宇:多源数据融合与时空数据挖掘(下)
微软研究院AI头条
18+阅读 · 2017年4月18日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员