Stable Filtering for Efficient Dimensionality Reduction of Streaming Manifold Data - 专知论文

会员服务 ·

0

流形 · 降维 · 滤波 · 结构 · 数据流 ·

Stable Filtering for Efficient Dimensionality Reduction of Streaming Manifold Data

翻译：流形数据流的高效降维：稳定滤波方法

Nicholas P. Bertrand,Eva Yezerets,Han Lun Yap,Adam S. Charles,Christopher J. Rozell

from arxiv, 17 pages, 6 figures

Many areas in science and engineering now have access to technologies that enable the rapid collection of overwhelming data volumes. While these datasets are vital for understanding phenomena from physical to biological and social systems, the sheer magnitude of the data makes even simple storage, transmission, and basic processing highly challenging. To enable efficient and accurate execution of these data processing tasks, we require new dimensionality reduction tools that 1) do not need expensive, time-consuming training, and 2) preserve the underlying geometry of the data that has the information required to understand the measured system. Specifically, the geometry to be preserved is that induced by the fact that in many applications, streaming high-dimensional data evolves on a low-dimensional attractor manifold. Importantly, we may not know the exact structure of this manifold a priori. To solve these challenges, we present randomized filtering (RF), which leverages a specific instantiation of randomized dimensionality reduction to provably preserve non-linear manifold structure in the embedded space while remaining data-independent and computationally efficient. In this work we build on the rich theoretical promise of randomized dimensionality reduction to develop RF as a real, practical approach. We introduce novel methods, analysis, and experimental verification to illuminate the practicality of RF in diverse scientific applications, including several simulated and real-data examples that showcase the tangible benefits of RF.

翻译：当前，科学与工程领域的许多学科已具备快速采集海量数据的技术能力。虽然这些数据集对于理解从物理到生物乃至社会系统的各类现象至关重要，但其庞大规模使得即使是简单的存储、传输与基础处理也极具挑战性。为实现高效且准确的数据处理任务，我们需要新型降维工具，其应满足：1）无需昂贵耗时的训练过程；2）保持数据底层几何结构，该结构蕴含着理解被测系统所需的信息。具体而言，需要保持的几何特性源于这样一个事实：在许多应用场景中，高维数据流演化于低维吸引子流形之上。值得注意的是，我们可能无法预先获知该流形的确切结构。为应对这些挑战，本文提出随机滤波方法，该方法通过特定形式的随机降维技术，在理论上保证嵌入空间中的非线性流形结构得以保持，同时保持数据无关性与计算高效性。本研究基于随机降维的丰富理论前景，将随机滤波发展为切实可行的实用方法。我们通过引入创新方法、理论分析与实验验证，阐明随机滤波在多样化科学应用中的实用性，包括多个模拟与真实数据案例，充分展示了该方法带来的实际效益。

0

相关内容

《数据创新：桥接传统方法与大型语言模型以应对罕见高影响事件》最新报告

《数据创新：桥接传统方法与大型语言模型以应对罕见高影响事件》最新报告

专知会员服务

18+阅读 · 2月25日

【新书】非负矩阵与张量分解：在探索性多向数据分析与盲源分离中的应用，205页pdf

【新书】非负矩阵与张量分解：在探索性多向数据分析与盲源分离中的应用，205页pdf

专知会员服务

23+阅读 · 2025年9月21日

【新书】流形学习：工程中的模型降维

【新书】流形学习：工程中的模型降维

专知会员服务

53+阅读 · 2024年11月9日

【新书】高维概率：数据科学中的应用导论，305页pdf

【新书】高维概率：数据科学中的应用导论，305页pdf

专知会员服务

61+阅读 · 2024年9月1日

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

专知会员服务

21+阅读 · 2022年12月13日

【ICASSP2022教程】高维数据的低维模型:从线性到非线性，凸到非凸，浅到深，429页ppt

【ICASSP2022教程】高维数据的低维模型:从线性到非线性，凸到非凸，浅到深，429页ppt

专知会员服务

79+阅读 · 2022年6月12日

图像去噪方法概述

专知会员服务

43+阅读 · 2021年8月30日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，730页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，730页pdf

专知会员服务

136+阅读 · 2020年12月8日

【斯坦福大学博士论文】大规模和高维统计学习方法和算法，147页pdf

【斯坦福大学博士论文】大规模和高维统计学习方法和算法，147页pdf

专知会员服务

105+阅读 · 2020年6月13日

【DeepMind】基于变换的大规模数据对抗视频预测，Transformation-based Adversarial Video Prediction on Large-Scale Data

【DeepMind】基于变换的大规模数据对抗视频预测，Transformation-based Adversarial Video Prediction on Large-Scale Data

专知会员服务

17+阅读 · 2020年3月9日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

清华大学《高级机器学习》课程

清华大学《高级机器学习》课程

专知

40+阅读 · 2020年7月21日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

如何做数据治理？

如何做数据治理？

智能交通技术

19+阅读 · 2019年4月20日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

谷歌实习生提出tSNE在大型高维数据集上实时可视化的方法（附代码）

谷歌实习生提出tSNE在大型高维数据集上实时可视化的方法（附代码）

论智

13+阅读 · 2018年6月8日

Spark机器学习：矩阵及推荐算法

Spark机器学习：矩阵及推荐算法

LibRec智能推荐

16+阅读 · 2017年8月3日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

面向在线检索的医学影像多特征降维方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

函数数据变换模型及降维方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

超高维数据中若干检验问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

大数据高效能存储与管理方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay

Arxiv

0+阅读 · 2月16日

EntroGD: Scalable Generalized Deduplication for Efficient Direct Analytics on Compressed IoT Data

Arxiv

0+阅读 · 2月10日

Reducing Aleatoric and Epistemic Uncertainty through Multi-modal Data Acquisition

Arxiv

0+阅读 · 2月9日

Improving 2D Diffusion Models for 3D Medical Imaging with Inter-Slice Consistent Stochasticity

Arxiv

0+阅读 · 2月9日

Improving Data and Reward Design for Scientific Reasoning in Large Language Models

Arxiv

0+阅读 · 2月9日

Towards Scalable Visual Data Wrangling via Direct Manipulation

Arxiv

0+阅读 · 2月7日

Elastic Data Transfer Optimization with Hybrid Reinforcement Learning

Arxiv

0+阅读 · 2月7日

Dimensionality Reduction on Riemannian Manifolds in Data Analysis

Arxiv

0+阅读 · 2月5日

Streaming Operator Inference for Model Reduction of Large-Scale Dynamical Systems

Arxiv

0+阅读 · 2月5日

Exploring Collaborative Immersive Visualization & Analytics for High-Dimensional Scientific Data through Domain Expert Perspectives

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

《数据创新：桥接传统方法与大型语言模型以应对罕见高影响事件》最新报告

《数据创新：桥接传统方法与大型语言模型以应对罕见高影响事件》最新报告

专知会员服务

18+阅读 · 2月25日

【新书】非负矩阵与张量分解：在探索性多向数据分析与盲源分离中的应用，205页pdf

【新书】非负矩阵与张量分解：在探索性多向数据分析与盲源分离中的应用，205页pdf

专知会员服务

23+阅读 · 2025年9月21日

【新书】流形学习：工程中的模型降维

【新书】流形学习：工程中的模型降维

专知会员服务

53+阅读 · 2024年11月9日

【新书】高维概率：数据科学中的应用导论，305页pdf

【新书】高维概率：数据科学中的应用导论，305页pdf

专知会员服务

61+阅读 · 2024年9月1日

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

专知会员服务

21+阅读 · 2022年12月13日

【ICASSP2022教程】高维数据的低维模型:从线性到非线性，凸到非凸，浅到深，429页ppt

【ICASSP2022教程】高维数据的低维模型:从线性到非线性，凸到非凸，浅到深，429页ppt

专知会员服务

79+阅读 · 2022年6月12日

图像去噪方法概述

专知会员服务

43+阅读 · 2021年8月30日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，730页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，730页pdf

专知会员服务

136+阅读 · 2020年12月8日

【斯坦福大学博士论文】大规模和高维统计学习方法和算法，147页pdf

【斯坦福大学博士论文】大规模和高维统计学习方法和算法，147页pdf

专知会员服务

105+阅读 · 2020年6月13日

【DeepMind】基于变换的大规模数据对抗视频预测，Transformation-based Adversarial Video Prediction on Large-Scale Data

【DeepMind】基于变换的大规模数据对抗视频预测，Transformation-based Adversarial Video Prediction on Large-Scale Data

专知会员服务

17+阅读 · 2020年3月9日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

清华大学《高级机器学习》课程

清华大学《高级机器学习》课程

专知

40+阅读 · 2020年7月21日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

如何做数据治理？

如何做数据治理？

智能交通技术

19+阅读 · 2019年4月20日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

简述多种降维算法

简述多种降维算法

算法与数学之美

11+阅读 · 2018年9月23日

谷歌实习生提出tSNE在大型高维数据集上实时可视化的方法（附代码）

谷歌实习生提出tSNE在大型高维数据集上实时可视化的方法（附代码）

论智

13+阅读 · 2018年6月8日

Spark机器学习：矩阵及推荐算法

Spark机器学习：矩阵及推荐算法

LibRec智能推荐

16+阅读 · 2017年8月3日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

相关论文

Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay

Arxiv

0+阅读 · 2月16日

EntroGD: Scalable Generalized Deduplication for Efficient Direct Analytics on Compressed IoT Data

Arxiv

0+阅读 · 2月10日

Reducing Aleatoric and Epistemic Uncertainty through Multi-modal Data Acquisition

Arxiv

0+阅读 · 2月9日

Improving 2D Diffusion Models for 3D Medical Imaging with Inter-Slice Consistent Stochasticity

Arxiv

0+阅读 · 2月9日

Improving Data and Reward Design for Scientific Reasoning in Large Language Models

Arxiv

0+阅读 · 2月9日

Towards Scalable Visual Data Wrangling via Direct Manipulation

Arxiv

0+阅读 · 2月7日

Elastic Data Transfer Optimization with Hybrid Reinforcement Learning

Arxiv

0+阅读 · 2月7日

Dimensionality Reduction on Riemannian Manifolds in Data Analysis

Arxiv

0+阅读 · 2月5日

Streaming Operator Inference for Model Reduction of Large-Scale Dynamical Systems

Arxiv

0+阅读 · 2月5日

Exploring Collaborative Immersive Visualization & Analytics for High-Dimensional Scientific Data through Domain Expert Perspectives

Arxiv

0+阅读 · 2月4日

相关基金

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

面向在线检索的医学影像多特征降维方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

函数数据变换模型及降维方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

超高维数据中若干检验问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

大数据高效能存储与管理方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员