Despite its extensive development for multivariate data, semi-supervised learning remains underdeveloped for functional data. To address this challenge, we extend the Fermat distance, a density-sensitive metric aligning with the semi-supervised setting, to the functional domain. Leveraging the Fermat distance, we propose novel semi-supervised classifiers, including the weighted $k$-nearest neighbors (NN) classifier and multidimensional scaling (MDS)-induced classifiers. To accommodate massive datasets commonly seen in semi-supervised applications, we design a computationally efficient estimation procedure tailored for discrete and noisy functional observations. Theoretically, we establish exponentially decaying convergence rates of the $k$-NN classifier and the consistency of the estimated Fermat distance. Crucially, our results reveal a phenomenon unique to error-contaminated functional data: Incorporating unlabeled data leads to improved classification accuracy only when the individual sampling rate grows sufficiently fast. Applying our framework to simulated data and a large-scale dataset of Gaia astronomical spectra, we demonstrate that our proposed semi-supervised classifiers uniformly outperform existing supervised benchmarks.


翻译:尽管针对多元数据的半监督学习已有广泛发展,但该方法在函数型数据领域仍相对滞后。为应对这一挑战,我们将费马距离——一种与半监督场景相契合的密度敏感度量——扩展至函数域。基于费马距离,我们提出了新型半监督分类器,包括加权$k$近邻分类器与多维缩放诱导分类器。为适应半监督应用中常见的大规模数据集,我们设计了针对离散含噪函数观测值的高效计算估计流程。在理论上,我们建立了$k$近邻分类器的指数衰减收敛速率及费马距离估计的一致性。关键的是,我们的结果揭示了一个误差污染函数型数据特有的现象:仅当个体采样率增长足够快时,纳入未标注数据才能提升分类精度。通过将框架应用于模拟数据及盖亚天文光谱大规模数据集,我们证明所提出的半监督分类器在性能上全面超越现有监督基准方法。

0
下载
关闭预览

相关内容

监督和半监督学习下的多标签分类综述
专知会员服务
46+阅读 · 2022年8月3日
专知会员服务
38+阅读 · 2021年3月29日
电子科大最新《深度半监督学习》综述论文,24页pdf
专知会员服务
90+阅读 · 2021年3月6日
【CVPR2019】弱监督图像分类建模
深度学习大讲堂
38+阅读 · 2019年7月25日
半监督深度学习小结:类协同训练和一致性正则化
半监督多任务学习:Semisupervised Multitask Learning
我爱读PAMI
18+阅读 · 2018年4月29日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
1+阅读 · 今天15:00
21世纪的无人机战争
专知会员服务
2+阅读 · 今天14:05
《量子技术的军事任务技术适配与利用》
专知会员服务
2+阅读 · 今天13:51
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员