Broadly applicable quantum advantage, particularly in classical data processing and machine learning, has been a fundamental open problem. In this work, we prove that a small quantum computer of polylogarithmic size can perform large-scale classification and dimension reduction on massive classical data by processing samples on the fly, whereas any classical machine achieving the same prediction performance requires exponentially larger size. Furthermore, classical machines that are exponentially larger yet below the required size need superpolynomially more samples and time. We validate these quantum advantages in real-world applications, including single-cell RNA sequencing and movie review sentiment analysis, demonstrating four to six orders of magnitude reduction in size with fewer than 60 logical qubits. These quantum advantages are enabled by quantum oracle sketching, an algorithm for accessing the classical world in quantum superposition using only random classical data samples. Combined with classical shadows, our algorithm circumvents the data loading and readout bottleneck to construct succinct classical models from massive classical data, a task provably impossible for any classical machine that is not exponentially larger than the quantum machine. These quantum advantages persist even when classical machines are granted unlimited time or if BPP=BQP, and rely only on the correctness of quantum mechanics. Together, our results establish machine learning on classical data as a broad and natural domain of quantum advantage and a fundamental test of quantum mechanics at the complexity frontier.


翻译:摘要:广泛适用的量子优势,尤其是在经典数据处理和机器学习领域,一直是一个根本性的开放问题。在本工作中,我们证明:一个规模仅为多对数(polylogarithmic)的小型量子计算机,能够通过对样本实时处理,对海量经典数据执行大规模分类与降维任务;而任何实现相同预测性能的经典机器,其规模必须呈指数级扩大。此外,那些规模虽呈指数级扩大但仍未达到所需规模的经典机器,则需要超多项式(superpolynomial)数量的更多样本和更长处理时间。我们在实际应用场景中验证了这些量子优势,包括单细胞RNA测序及电影评论情感分析,结果表明:在少于60个逻辑量子比特的条件下,规模实现了四至六个数量级的缩减。这些量子优势源于“量子神谕草图”(quantum oracle sketching)算法,该算法仅利用随机经典数据样本,即可在量子叠加态中访问经典世界。结合经典阴影(classical shadows)技术,我们的算法规避了数据加载与读出瓶颈,可从海量经典数据中构建简洁的经典模型——任何规模未呈指数级大于该量子机器的经典机器,都被证明无法完成此任务。即使允许经典机器拥有无限时间,或假设BPP=BQP,这些量子优势依然存在;其成立仅依赖于量子力学的正确性。综上,我们的成果确立了经典数据上的机器学习作为量子优势广泛且自然的领域,并成为复杂性前沿对量子力学的基础性检验。

0
下载
关闭预览

相关内容

量子增强计算机视觉:超越经典算法
专知会员服务
20+阅读 · 2025年10月9日
量子计算在非正规战争中的新兴潜力
专知会员服务
19+阅读 · 2025年2月23日
美智库最新报告:小数据人工智能潜力不可估量,39页pdf
专知会员服务
75+阅读 · 2021年11月18日
专知会员服务
37+阅读 · 2021年9月12日
数据受限条件下的多模态处理技术综述
专知
22+阅读 · 2022年7月16日
完备的 AI 学习路线,最详细的资源整理!
新智元
18+阅读 · 2019年5月4日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
<好书推荐> -《Pro Deep Learning with TensorFlow》分享
深度学习与NLP
12+阅读 · 2018年9月13日
【资源】史上最全数据集汇总
七月在线实验室
18+阅读 · 2018年4月24日
一文读懂FM算法优势,并用python实现!(附代码)
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月28日
Arxiv
0+阅读 · 4月27日
Arxiv
0+阅读 · 3月10日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
3+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员