【ICML2025】立场：我们需要对生成式人工智能的算法理解 - 专知VIP

会员服务 ·

11

ICML 2025 · 生成式人工智能 ·

2025 年 7 月 12 日

【ICML2025】立场：我们需要对生成式人工智能的算法理解

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大规模语言模型（LLM）实际学习和使用什么算法来解决问题？

关于这个问题的研究较少，因为目前的研究重点主要集中在通过扩大规模来提高性能，从而留下了在理解新兴算法方面的理论和经验空白。本文提出了AlgEval：一个用于系统性研究LLM学习和使用的算法框架。AlgEval旨在揭示反映在潜在表示、注意力机制和推理时计算中的算法原语，以及它们的算法组合，来解决特定任务问题。

我们强调了实现这一目标的潜在方法路径，并以一个关于新兴搜索算法的案例研究为重点。我们的案例研究展示了关于候选算法的自上而下假设的形成，以及通过对注意力模式和隐藏状态的电路级分析进行这些假设的自下而上的验证。对LLM如何实际解决任务的严格系统评估为资源密集型的扩展提供了替代方案，并将研究方向重新引导向对底层计算的原则性理解。这种算法解释为人类可理解的可解释性提供了一条路径，使得对模型内部推理过程和性能衡量的理解成为可能。反过来，这也可以导致更高效的样本训练方法，提高性能，并为端到端和多智能体系统提供新的架构。

成为VIP会员查看完整内容

17

相关内容

ICML 2025

【ICML2025】FOUNDER：将基础模型嵌入世界模型以实现开放式具身决策

【ICML2025】FOUNDER：将基础模型嵌入世界模型以实现开放式具身决策

专知会员服务

13+阅读 · 2025年7月19日

【ICML2025】通过在线世界模型规划的持续强化学习

【ICML2025】通过在线世界模型规划的持续强化学习

专知会员服务

20+阅读 · 2025年7月18日

【ICML2025】大语言模型是自我示范预选择器

【ICML2025】大语言模型是自我示范预选择器

专知会员服务

13+阅读 · 2025年6月9日

【CVPR2025】知识桥接器：走向无训练的缺失模态补全

【CVPR2025】知识桥接器：走向无训练的缺失模态补全

专知会员服务

14+阅读 · 2025年2月28日

【NeurIPS2024】在复杂视觉推理场景中学习迭代和并行推理

【NeurIPS2024】在复杂视觉推理场景中学习迭代和并行推理

专知会员服务

17+阅读 · 2024年11月30日

【NeurIPS2024】迈向统一的多模态编辑与增强的知识协作

【NeurIPS2024】迈向统一的多模态编辑与增强的知识协作

专知会员服务

20+阅读 · 2024年10月1日

【ICML2024】深度强化学习中的随机潜在探索

【ICML2024】深度强化学习中的随机潜在探索

专知会员服务

20+阅读 · 2024年7月19日

【ICWS 2023】ProcessGPT：利用生成人工智能转变业务流程管理

【ICWS 2023】ProcessGPT：利用生成人工智能转变业务流程管理

专知会员服务

25+阅读 · 2024年5月18日

【ICML2021】去中心化分布式训练的最优复杂度

专知会员服务

26+阅读 · 2021年9月28日

【KDD2021】知识增强领域自适应的少样本关系分类

专知会员服务

38+阅读 · 2021年9月15日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

55+阅读 · 2022年4月25日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

23+阅读 · 2020年7月3日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

【论文笔记】基于LSTM的问答对排序

【论文笔记】基于LSTM的问答对排序

专知

12+阅读 · 2019年9月7日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

38+阅读 · 2019年7月25日

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

机器之心

18+阅读 · 2019年6月12日

TensorFlow动态图5行代码实现迁移学习 - 识别转变风格的MNIST

TensorFlow动态图5行代码实现迁移学习 - 识别转变风格的MNIST

专知

18+阅读 · 2019年4月26日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【深度学习基础】4. Recurrent Neural Networks

【深度学习基础】4. Recurrent Neural Networks

微信AI

16+阅读 · 2017年7月19日

不完全信息下的投资组合选择模型研究：一个时间一致性的视角

国家自然科学基金

5+阅读 · 2015年12月31日

粗糙回归模型与算法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

47+阅读 · 2015年12月31日

基于上下文感知和异质特征集成的SAR图像分割与评价

国家自然科学基金

2+阅读 · 2015年12月31日

基于非对称群体兴趣相关性并融合情境与群体信任的Web服务推荐研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

17+阅读 · 2015年12月31日

无网格DEM构建方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

Web页面数据对象的感知理解与计算

国家自然科学基金

0+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

176+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

43+阅读 · 2023年4月19日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

88+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

156+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

64+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

83+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

182+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

27+阅读 · 2023年3月17日

VIP会员

相关主题

生成式人工智能

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

2+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

4+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

3+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

【ICML2025】FOUNDER：将基础模型嵌入世界模型以实现开放式具身决策

【ICML2025】FOUNDER：将基础模型嵌入世界模型以实现开放式具身决策

专知会员服务

13+阅读 · 2025年7月19日

【ICML2025】通过在线世界模型规划的持续强化学习

【ICML2025】通过在线世界模型规划的持续强化学习

专知会员服务

20+阅读 · 2025年7月18日

【ICML2025】大语言模型是自我示范预选择器

【ICML2025】大语言模型是自我示范预选择器

专知会员服务

13+阅读 · 2025年6月9日

【CVPR2025】知识桥接器：走向无训练的缺失模态补全

【CVPR2025】知识桥接器：走向无训练的缺失模态补全

专知会员服务

14+阅读 · 2025年2月28日

【NeurIPS2024】在复杂视觉推理场景中学习迭代和并行推理

【NeurIPS2024】在复杂视觉推理场景中学习迭代和并行推理

专知会员服务

17+阅读 · 2024年11月30日

【NeurIPS2024】迈向统一的多模态编辑与增强的知识协作

【NeurIPS2024】迈向统一的多模态编辑与增强的知识协作

专知会员服务

20+阅读 · 2024年10月1日

【ICML2024】深度强化学习中的随机潜在探索

【ICML2024】深度强化学习中的随机潜在探索

专知会员服务

20+阅读 · 2024年7月19日

【ICWS 2023】ProcessGPT：利用生成人工智能转变业务流程管理

【ICWS 2023】ProcessGPT：利用生成人工智能转变业务流程管理

专知会员服务

25+阅读 · 2024年5月18日

【ICML2021】去中心化分布式训练的最优复杂度

专知会员服务

26+阅读 · 2021年9月28日

【KDD2021】知识增强领域自适应的少样本关系分类

专知会员服务

38+阅读 · 2021年9月15日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

55+阅读 · 2022年4月25日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

23+阅读 · 2020年7月3日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

【论文笔记】基于LSTM的问答对排序

【论文笔记】基于LSTM的问答对排序

专知

12+阅读 · 2019年9月7日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

38+阅读 · 2019年7月25日

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

机器之心

18+阅读 · 2019年6月12日

TensorFlow动态图5行代码实现迁移学习 - 识别转变风格的MNIST

TensorFlow动态图5行代码实现迁移学习 - 识别转变风格的MNIST

专知

18+阅读 · 2019年4月26日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【深度学习基础】4. Recurrent Neural Networks

【深度学习基础】4. Recurrent Neural Networks

微信AI

16+阅读 · 2017年7月19日

相关基金

不完全信息下的投资组合选择模型研究：一个时间一致性的视角

国家自然科学基金

5+阅读 · 2015年12月31日

粗糙回归模型与算法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

47+阅读 · 2015年12月31日

基于上下文感知和异质特征集成的SAR图像分割与评价

国家自然科学基金

2+阅读 · 2015年12月31日

基于非对称群体兴趣相关性并融合情境与群体信任的Web服务推荐研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

17+阅读 · 2015年12月31日

无网格DEM构建方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

Web页面数据对象的感知理解与计算

国家自然科学基金

0+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

176+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

43+阅读 · 2023年4月19日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

88+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

156+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

64+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

83+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

182+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

27+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员