Competition for attention predicts good-to-bad tipping in AI - 专知论文

会员服务 ·

0

潜在 · 法律 · 损失 · 工具 · 边缘 ·

Competition for attention predicts good-to-bad tipping in AI

翻译：注意力竞争预测人工智能的良劣临界转变

Neil F. Johnson,Frank Y. Huo

More than half the global population now carries devices that can run ChatGPT-like language models with no Internet connection and minimal safety oversight -- and hence the potential to promote self-harm, financial losses and extremism among other dangers. Existing safety tools either require cloud connectivity or discover failures only after harm has occurred. Here we show that a large class of potentially dangerous tipping originates at the atomistic scale in such edge AI due to competition for the machinery's attention. This yields a mathematical formula for the dynamical tipping point n*, governed by dot-product competition for attention between the conversation's context and competing output basins, that reveals new control levers. Validated against multiple AI models, the mechanism can be instantiated for different definitions of 'good' and 'bad' and hence in principle applies across domains (e.g. health, law, finance, defense), changing legal landscapes (e.g. EU, UK, US and state level), languages, and cultural settings.

翻译：目前全球超过一半人口携带的设备能够离线运行类似ChatGPT的语言模型，且安全监管极为有限——这可能导致自我伤害、经济损失和极端主义等潜在危险。现有安全工具要么依赖云端连接，要么只能在损害发生后发现故障。本文证明，在此类边缘人工智能中，大量潜在危险临界转变源于机器注意力竞争的微观机制。我们推导出由对话上下文与竞争输出域之间的点积注意力竞争所主导的动态临界点n*的数学公式，揭示了新的控制机制。该机制在多个AI模型中得到验证，可根据"良"与"劣"的不同定义进行实例化，因此原则上适用于跨领域应用（如医疗、法律、金融、国防）、不断变化的法律环境（如欧盟、英国、美国及各州层面）、不同语言和文化场景。

0

相关内容

《更智能的边缘：边缘计算如何推动美国人工智能领导力与能源安全》报告

《更智能的边缘：边缘计算如何推动美国人工智能领导力与能源安全》报告

专知会员服务

17+阅读 · 3月7日

《迈向人工智能赋能网络威胁的风险阈值：利用贝叶斯网络增强不确定性下的决策能力》最新60页报告

《迈向人工智能赋能网络威胁的风险阈值：利用贝叶斯网络增强不确定性下的决策能力》最新60页报告

专知会员服务

20+阅读 · 3月2日

《人工智能对网络安全的影响：攻防平衡的转变》46页报告

《人工智能对网络安全的影响：攻防平衡的转变》46页报告

专知会员服务

24+阅读 · 2025年4月13日

作战规划中的人工智能：深入探讨如何将 AlphaGo 等人工智能融入军事规划，从而彻底改变战略决策

作战规划中的人工智能：深入探讨如何将 AlphaGo 等人工智能融入军事规划，从而彻底改变战略决策

专知会员服务

95+阅读 · 2024年3月21日

被重塑的世界？ChatGPT崛起下人工智能与国家安全新特征

被重塑的世界？ChatGPT崛起下人工智能与国家安全新特征

专知会员服务

72+阅读 · 2023年10月23日

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

专知会员服务

48+阅读 · 2023年7月23日

人工智能全球安全治理的发展态势与新动向

人工智能全球安全治理的发展态势与新动向

专知会员服务

46+阅读 · 2023年5月21日

人工智能的安全性，公平性，可问责性，透明度，一致性，77页ppt

人工智能的安全性，公平性，可问责性，透明度，一致性，77页ppt

专知会员服务

51+阅读 · 2023年5月1日

推荐！《预测与判断：为什么人工智能会增加人类在战争中的重要性》2022.2 MIT最新出版，附讲解PPT与video

推荐！《预测与判断：为什么人工智能会增加人类在战争中的重要性》2022.2 MIT最新出版，附讲解PPT与video

专知会员服务

81+阅读 · 2022年5月5日

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

专知会员服务

89+阅读 · 2022年4月29日

万字长文解读：从Transformer到ChatGPT，通用人工智能曙光初现

万字长文解读：从Transformer到ChatGPT，通用人工智能曙光初现

CSDN

16+阅读 · 2023年4月12日

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

专知

87+阅读 · 2022年7月29日

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

专知

73+阅读 · 2022年6月30日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

91+阅读 · 2022年4月17日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

边缘智能发展与演进白皮书

边缘智能发展与演进白皮书

物联网智库

13+阅读 · 2019年6月17日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

人工智能对网络空间安全的影响

人工智能对网络空间安全的影响

走向智能论坛

21+阅读 · 2018年6月7日

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

人类双向选择行为的统计特征分析与预测方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

On the Role of Artificial Intelligence in Human-Machine Symbiosis

Arxiv

0+阅读 · 5月1日

When and How AI Should Assist Brainstorming for AI Impact Assessment

Arxiv

0+阅读 · 4月30日

Human Agency, Causality, and the Human Computer Interface in High-Stakes Artificial Intelligence

Arxiv

0+阅读 · 4月14日

Latent Profiles of AI Risk Perception and Their Differential Association with Community Driving Safety Concerns: A Person-Centered Analysis

Arxiv

0+阅读 · 4月6日

A Computationally Efficient Learning of Artificial Intelligence System Reliability Considering Error Propagation

Arxiv

0+阅读 · 3月18日

Evasive Intelligence: Lessons from Malware Analysis for Evaluating AI Agents

Arxiv

0+阅读 · 3月16日

Inclusive AI for Group Interactions: Predicting Gaze-Direction Behaviors in People with Intellectual and Developmental Disabilities

Arxiv

0+阅读 · 3月15日

Cybersecurity AI: Hacking Consumer Robots in the AI Era

Arxiv

0+阅读 · 3月9日

ForesightSafety Bench: A Frontier Risk Evaluation and Governance Framework towards Safe AI

Arxiv

0+阅读 · 2月27日

Work Design and Multidimensional AI Threat as Predictors of Workplace AI Adoption and Depth of Use

Arxiv

0+阅读 · 2月26日

VIP会员

文章信息

相关主题

最新内容

当AI代理处理机密：面向代理式AI的机密计算综述

当AI代理处理机密：面向代理式AI的机密计算综述

专知会员服务

2+阅读 · 5月9日

【博士论文】基于信息论探索的强化学习与控制：安全性、最优性及其应用研究

【博士论文】基于信息论探索的强化学习与控制：安全性、最优性及其应用研究

专知会员服务

3+阅读 · 5月9日

【ICML2026】MASPO：面向基于大语言模型的多智能体系统的联合提示词优化

【ICML2026】MASPO：面向基于大语言模型的多智能体系统的联合提示词优化

专知会员服务

2+阅读 · 5月9日

美国军方使用的10种反无人机武器（2026年更新）

美国军方使用的10种反无人机武器（2026年更新）

专知会员服务

11+阅读 · 5月9日

智能技术在战场指挥控制系统中的应用（附中英文版下载）

智能技术在战场指挥控制系统中的应用（附中英文版下载）

专知会员服务

15+阅读 · 5月9日

北约《俄乌战争经验教训课程指南：25份课程计划》150页

北约《俄乌战争经验教训课程指南：25份课程计划》150页

专知会员服务

14+阅读 · 5月9日

《不确定性环境下基于智能体框架中实时多机器人任务分配的贝叶斯网络》博士论文

《不确定性环境下基于智能体框架中实时多机器人任务分配的贝叶斯网络》博士论文

专知会员服务

8+阅读 · 5月9日

首场人工智能战争——俄乌战争（中文版、原文下载）

首场人工智能战争——俄乌战争（中文版、原文下载）

专知会员服务

27+阅读 · 5月9日

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

专知会员服务

10+阅读 · 5月9日

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

专知会员服务

6+阅读 · 5月9日

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

专知会员服务

4+阅读 · 5月9日

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

专知会员服务

12+阅读 · 5月8日

生成-过滤-控制-重放：LLM强化学习中Rollout策略的全面综述

生成-过滤-控制-重放：LLM强化学习中Rollout策略的全面综述

专知会员服务

8+阅读 · 5月8日

认知战与交战性质的改变：神经战略视角

认知战与交战性质的改变：神经战略视角

专知会员服务

7+阅读 · 5月8日

美国《国防授权法案》指令要求界定“认知战”：区分相关概念

美国《国防授权法案》指令要求界定“认知战”：区分相关概念

专知会员服务

6+阅读 · 5月8日

相关VIP内容

《更智能的边缘：边缘计算如何推动美国人工智能领导力与能源安全》报告

《更智能的边缘：边缘计算如何推动美国人工智能领导力与能源安全》报告

专知会员服务

17+阅读 · 3月7日

《迈向人工智能赋能网络威胁的风险阈值：利用贝叶斯网络增强不确定性下的决策能力》最新60页报告

《迈向人工智能赋能网络威胁的风险阈值：利用贝叶斯网络增强不确定性下的决策能力》最新60页报告

专知会员服务

20+阅读 · 3月2日

《人工智能对网络安全的影响：攻防平衡的转变》46页报告

《人工智能对网络安全的影响：攻防平衡的转变》46页报告

专知会员服务

24+阅读 · 2025年4月13日

作战规划中的人工智能：深入探讨如何将 AlphaGo 等人工智能融入军事规划，从而彻底改变战略决策

作战规划中的人工智能：深入探讨如何将 AlphaGo 等人工智能融入军事规划，从而彻底改变战略决策

专知会员服务

95+阅读 · 2024年3月21日

被重塑的世界？ChatGPT崛起下人工智能与国家安全新特征

被重塑的世界？ChatGPT崛起下人工智能与国家安全新特征

专知会员服务

72+阅读 · 2023年10月23日

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

专知会员服务

48+阅读 · 2023年7月23日

人工智能全球安全治理的发展态势与新动向

人工智能全球安全治理的发展态势与新动向

专知会员服务

46+阅读 · 2023年5月21日

人工智能的安全性，公平性，可问责性，透明度，一致性，77页ppt

人工智能的安全性，公平性，可问责性，透明度，一致性，77页ppt

专知会员服务

51+阅读 · 2023年5月1日

推荐！《预测与判断：为什么人工智能会增加人类在战争中的重要性》2022.2 MIT最新出版，附讲解PPT与video

推荐！《预测与判断：为什么人工智能会增加人类在战争中的重要性》2022.2 MIT最新出版，附讲解PPT与video

专知会员服务

81+阅读 · 2022年5月5日

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

专知会员服务

89+阅读 · 2022年4月29日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】基于信息论探索的强化学习与控制：安全性、最优性及其应用研究

美国军方使用的10种反无人机武器（2026年更新）

当AI代理处理机密：面向代理式AI的机密计算综述

【ICML2026】MASPO：面向基于大语言模型的多智能体系统的联合提示词优化

相关资讯

万字长文解读：从Transformer到ChatGPT，通用人工智能曙光初现

万字长文解读：从Transformer到ChatGPT，通用人工智能曙光初现

CSDN

16+阅读 · 2023年4月12日

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

专知

87+阅读 · 2022年7月29日

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

专知

73+阅读 · 2022年6月30日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

91+阅读 · 2022年4月17日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

深度学习的下一步：Transformer和注意力机制

深度学习的下一步：Transformer和注意力机制

云头条

56+阅读 · 2019年9月14日

边缘智能发展与演进白皮书

边缘智能发展与演进白皮书

物联网智库

13+阅读 · 2019年6月17日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

人工智能对网络空间安全的影响

人工智能对网络空间安全的影响

走向智能论坛

21+阅读 · 2018年6月7日

相关论文

On the Role of Artificial Intelligence in Human-Machine Symbiosis

Arxiv

0+阅读 · 5月1日

When and How AI Should Assist Brainstorming for AI Impact Assessment

Arxiv

0+阅读 · 4月30日

Human Agency, Causality, and the Human Computer Interface in High-Stakes Artificial Intelligence

Arxiv

0+阅读 · 4月14日

Latent Profiles of AI Risk Perception and Their Differential Association with Community Driving Safety Concerns: A Person-Centered Analysis

Arxiv

0+阅读 · 4月6日

A Computationally Efficient Learning of Artificial Intelligence System Reliability Considering Error Propagation

Arxiv

0+阅读 · 3月18日

Evasive Intelligence: Lessons from Malware Analysis for Evaluating AI Agents

Arxiv

0+阅读 · 3月16日

Inclusive AI for Group Interactions: Predicting Gaze-Direction Behaviors in People with Intellectual and Developmental Disabilities

Arxiv

0+阅读 · 3月15日

Cybersecurity AI: Hacking Consumer Robots in the AI Era

Arxiv

0+阅读 · 3月9日

ForesightSafety Bench: A Frontier Risk Evaluation and Governance Framework towards Safe AI

Arxiv

0+阅读 · 2月27日

Work Design and Multidimensional AI Threat as Predictors of Workplace AI Adoption and Depth of Use

Arxiv

0+阅读 · 2月26日

相关基金

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

人类双向选择行为的统计特征分析与预测方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员