自监督表示学习能够从无标签数据中提取信息丰富的特征,构成了诸多现代机器学习方法的基础。然而,传统方法往往忽视了宝贵的专家与领域知识,而这些知识对于增强模型的可解释性、鲁棒性以及与现实世界语义的对齐至关重要。本论文探讨了如何系统性地将先验知识集成到自监督学习中,并将聚类与异常检测作为无监督学习的核心问题进行深入研究。 我们提出了一系列通过利用结构化先验和概率建模,将先验知识直接引入神经网络训练的方法。通过扩展变分自编码器(VAEs)以考虑样本间的依赖关系、层级关系及规范行为(normative behaviors),我们论证了自监督方法如何从通用的模式识别工具演变为语义理解机制。具体而言,我们展示了如何学习数据内部相关且层级化的聚类结构,以及如何编码关于正常状态(normality)的先验知识,以提升对稀有或特定领域异常项的检测能力。在这些设定下,集成先验知识能够持续产生更丰富的潜表示(latent representations),提高可解释性,并在特定领域展现出卓越的泛化性能。 综上所述,本论文的贡献表明,显式地将先验知识集成到机器学习中,所构建的模型不仅准确度更高,且能更好地捕获现实世界数据的语义。通过将数据驱动的学习与领域见解相对齐,我们获得的表示能够更深层次地揭示底层结构并支持知识发现,从而为迈向更具原则性、可解释性且应用感知的机器学习铺平道路。

成为VIP会员查看完整内容
1

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
面向图像分割的自监督学习:全面综述
专知会员服务
13+阅读 · 2025年5月26日
【博士论文】自监督学习视频表示
专知会员服务
26+阅读 · 2024年2月5日
【牛津大学博士论文】自监督视频表示学习,204页pdf
专知会员服务
40+阅读 · 2023年7月6日
《自监督学习》最新报告,45页ppt
专知会员服务
75+阅读 · 2022年9月14日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
167+阅读 · 2020年3月18日
对比自监督学习
深度学习自然语言处理
35+阅读 · 2020年7月15日
【自监督学习】OpenAI科学家一文详解自监督学习
产业智能官
25+阅读 · 2020年3月18日
OpenAI科学家一文详解自监督学习
新智元
18+阅读 · 2019年11月20日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员