Beyond the Binary: A nuanced path for open-weight advanced AI - 专知论文

会员服务 ·

0

路径 · 系统 · 人工智能 · 报告 · 适配 ·

Beyond the Binary: A nuanced path for open-weight advanced AI

翻译：超越二元对立：开放权重先进人工智能的精细化路径

Bengüsu Özcan,Alex Petropoulos,Max Reddel

from arxiv, This publication was originally designed and optimised for web and published on cfg.eu. Minor formatting differences may appear in this version

Open-weight advanced AI models -- systems whose parameters are freely available for download and adaptation -- are reshaping the global AI landscape. As these models rapidly close the performance gap with closed alternatives, they enable breakthrough research and broaden access to powerful tools. However, once released, they cannot be recalled, and their built-in safeguards can be bypassed through fine-tuning or jailbreaking, posing risks that current governance frameworks are not equipped to address. This report moves beyond the binary framing of ``open'' versus ``closed'' AI. We assess the current landscape of open-weight advanced AI, examining technical capabilities, risk profiles, and regulatory responses across the European Union, United States, China, the United Kingdom, and international forums. We find significant disparities in safety practices across developers and jurisdictions, with no commonly adopted standards for determining when or how advanced models should be released openly. We propose a tiered, safety-anchored approach to model release, where openness is determined by rigorous risk assessment and demonstrated safety rather than ideology or commercial pressure. We outline actionable recommendations for developers, evaluators, standard-setters, and policymakers to enable responsible openness while investing in technical safeguards and societal preparedness.

翻译：开放权重先进人工智能模型——其参数可供自由下载和适配的系统——正在重塑全球人工智能格局。随着这些模型在性能上迅速逼近闭源替代品，它们不仅推动了突破性研究，也拓宽了强大工具的获取渠道。然而，此类模型一旦发布便无法撤回，其内置安全防护措施可能通过微调或越狱手段被绕过，由此产生的风险是当前治理框架尚无法有效应对的。本报告突破“开放”与“封闭”人工智能的二元对立框架，系统评估当前开放权重先进AI的发展态势，从技术能力、风险特征及监管应对等维度，考察欧盟、美国、中国、英国及国际论坛的实践现状。研究发现，不同开发主体与司法管辖区在安全实践层面存在显著差异，且尚未形成关于何时或以何种方式开放高级模型的公认标准。我们提出一种分层化、安全锚定的模型发布框架，其中开放程度应由严格的风险评估和已验证的安全性决定，而非受意识形态或商业压力驱动。报告最后为开发者、评估机构、标准制定者及政策制定者提出可操作建议，旨在实现负责任开放的同时，持续加强技术防护体系与社会应对能力的建设。

0

相关内容

前沿人工智能趋势报告（Frontier AI Trends Report）

前沿人工智能趋势报告（Frontier AI Trends Report）

专知会员服务

39+阅读 · 2025年12月20日

OpenAI“开放权重模型”即将进入美军作战体系

OpenAI“开放权重模型”即将进入美军作战体系

专知会员服务

30+阅读 · 2025年11月20日

【新书】LLM 发展与人工智能伦理：人工智能安全、治理、生成式人工智能、大语言模型、提示工程与通用人工智能指南

【新书】LLM 发展与人工智能伦理：人工智能安全、治理、生成式人工智能、大语言模型、提示工程与通用人工智能指南

专知会员服务

23+阅读 · 2025年6月1日

中文版 | 重新定义数字时代冲突：人工智能的角色

中文版 | 重新定义数字时代冲突：人工智能的角色

专知会员服务

17+阅读 · 2025年5月3日

通往人工超智能的道路：超级对齐的全面综述

通往人工超智能的道路：超级对齐的全面综述

专知会员服务

43+阅读 · 2024年12月24日

通用多模态人工智能：架构、挑战和机遇综述

通用多模态人工智能：架构、挑战和机遇综述

专知会员服务

52+阅读 · 2024年6月29日

【COLING2024】从多模态大型语言模型到人类水平的人工智能：模态、指令、推理、效率及超越

【COLING2024】从多模态大型语言模型到人类水平的人工智能：模态、指令、推理、效率及超越

专知会员服务

32+阅读 · 2024年5月26日

人工智能、模块化开放系统架构和未来无人战争

人工智能、模块化开放系统架构和未来无人战争

专知会员服务

86+阅读 · 2024年4月4日

Ilya带头OpenAI超级对齐首篇论文《弱到强的泛化:在弱监督下获得强能力》，AI对齐AI取得实证结果

Ilya带头OpenAI超级对齐首篇论文《弱到强的泛化:在弱监督下获得强能力》，AI对齐AI取得实证结果

专知会员服务

53+阅读 · 2023年12月15日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

38+阅读 · 2020年1月13日

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

专知

178+阅读 · 2022年9月19日

2022人工智能十大关键词: 从大模型到可信落地，附人工智能白皮书下载

2022人工智能十大关键词: 从大模型到可信落地，附人工智能白皮书下载

专知

10+阅读 · 2022年8月18日

重磅！最新《人工智能白皮书（2022年）》发布，42页pdf

重磅！最新《人工智能白皮书（2022年）》发布，42页pdf

专知

25+阅读 · 2022年4月13日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

重磅！AI框架发展白皮书（2022年）,44页pdf

重磅！AI框架发展白皮书（2022年）,44页pdf

专知

28+阅读 · 2022年2月27日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

【MIT重磅】人工智能新技术综述：数据、算法、人机协作

【MIT重磅】人工智能新技术综述：数据、算法、人机协作

专知

13+阅读 · 2019年5月11日

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

新智元

20+阅读 · 2019年5月6日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

战略构想、知识搜寻与双元导向下企业技术创新能力演进：基于适应性演进和协同视角

国家自然科学基金

2+阅读 · 2015年12月31日

面向智能穿戴设备的三维图形网格简化与渐进显示方法

国家自然科学基金

1+阅读 · 2015年12月31日

软件定义开放光接入网理论模型和控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

创新如何开放：基于组织控制的研究

国家自然科学基金

3+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

领导行为作用下技术二元创新与商业模式匹配机理研究

国家自然科学基金

1+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

Beyond Benchmark Islands: Toward Representative Trustworthiness Evaluation for Agentic AI

Arxiv

0+阅读 · 3月16日

HyperParallel: A Supernode-Affinity AI Framework

Arxiv

0+阅读 · 3月4日

From Dyads to Groups: Rethinking Emotional Support with Conversational AI

Arxiv

0+阅读 · 2月28日

Beyond Mimicry to Contextual Guidance: Knowledge Distillation for Interactive AI

Arxiv

0+阅读 · 2月20日

Exposing the Systematic Vulnerability of Open-Weight Models to Prefill Attacks

Arxiv

0+阅读 · 2月16日

StackingNet: Collective Inference Across Independent AI Foundation Models

Arxiv

0+阅读 · 2月14日

Beyond Input-Output: Rethinking Creativity through Design-by-Analogy in Human-AI Collaboration

Arxiv

0+阅读 · 2月10日

Towards Cybersecurity Superintelligence: from AI-guided humans to human-guided AI

Arxiv

0+阅读 · 2月9日

Artificial Intelligence in Open Source Software Engineering: A Foundation for Sustainability

Arxiv

0+阅读 · 2月5日

Beyond Retrieval: A Modular Benchmark for Academic Deep Research Agents

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

Palantir AIP平台：连接智能体与决策

Palantir AIP平台：连接智能体与决策

专知会员服务

7+阅读 · 今天1:22

《应急响应数字孪生：整合增强现实与实时位置数据的模拟辅助决策》技术报告

《应急响应数字孪生：整合增强现实与实时位置数据的模拟辅助决策》技术报告

专知会员服务

3+阅读 · 今天1:17

《通用基于模型的系统工程交会与接近操作任务规划器》130页

《通用基于模型的系统工程交会与接近操作任务规划器》130页

专知会员服务

4+阅读 · 今天1:12

对ARL-TR-9623报告《人机自主协同团队信任工具包（HAT³）软件开发文档与用户指南》的增补材料

对ARL-TR-9623报告《人机自主协同团队信任工具包（HAT³）软件开发文档与用户指南》的增补材料

专知会员服务

3+阅读 · 今天1:11

《美海军软件测试战略》90页slides

《美海军软件测试战略》90页slides

专知会员服务

7+阅读 · 今天1:00

ACL 2026 综述：从事后解释到内生解释，大模型内生可解释性的前沿进展

ACL 2026 综述：从事后解释到内生解释，大模型内生可解释性的前沿进展

专知会员服务

5+阅读 · 4月30日

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

专知会员服务

5+阅读 · 4月30日

面向具身智能与机器人仿真的三维生成：综述

面向具身智能与机器人仿真的三维生成：综述

专知会员服务

6+阅读 · 4月30日

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

15+阅读 · 4月30日

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

7+阅读 · 4月30日

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

12+阅读 · 4月30日

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

7+阅读 · 4月30日

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

8+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

7+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

6+阅读 · 4月29日

相关VIP内容

前沿人工智能趋势报告（Frontier AI Trends Report）

前沿人工智能趋势报告（Frontier AI Trends Report）

专知会员服务

39+阅读 · 2025年12月20日

OpenAI“开放权重模型”即将进入美军作战体系

OpenAI“开放权重模型”即将进入美军作战体系

专知会员服务

30+阅读 · 2025年11月20日

【新书】LLM 发展与人工智能伦理：人工智能安全、治理、生成式人工智能、大语言模型、提示工程与通用人工智能指南

【新书】LLM 发展与人工智能伦理：人工智能安全、治理、生成式人工智能、大语言模型、提示工程与通用人工智能指南

专知会员服务

23+阅读 · 2025年6月1日

中文版 | 重新定义数字时代冲突：人工智能的角色

中文版 | 重新定义数字时代冲突：人工智能的角色

专知会员服务

17+阅读 · 2025年5月3日

通往人工超智能的道路：超级对齐的全面综述

通往人工超智能的道路：超级对齐的全面综述

专知会员服务

43+阅读 · 2024年12月24日

通用多模态人工智能：架构、挑战和机遇综述

通用多模态人工智能：架构、挑战和机遇综述

专知会员服务

52+阅读 · 2024年6月29日

【COLING2024】从多模态大型语言模型到人类水平的人工智能：模态、指令、推理、效率及超越

【COLING2024】从多模态大型语言模型到人类水平的人工智能：模态、指令、推理、效率及超越

专知会员服务

32+阅读 · 2024年5月26日

人工智能、模块化开放系统架构和未来无人战争

人工智能、模块化开放系统架构和未来无人战争

专知会员服务

86+阅读 · 2024年4月4日

Ilya带头OpenAI超级对齐首篇论文《弱到强的泛化:在弱监督下获得强能力》，AI对齐AI取得实证结果

Ilya带头OpenAI超级对齐首篇论文《弱到强的泛化:在弱监督下获得强能力》，AI对齐AI取得实证结果

专知会员服务

53+阅读 · 2023年12月15日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

38+阅读 · 2020年1月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《应急响应数字孪生：整合增强现实与实时位置数据的模拟辅助决策》技术报告

对ARL-TR-9623报告《人机自主协同团队信任工具包（HAT³）软件开发文档与用户指南》的增补材料

Palantir AIP平台：连接智能体与决策

《通用基于模型的系统工程交会与接近操作任务规划器》130页

相关资讯

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

《打人工智能之战：关于未来人工智能战争的作战概念》澳大利亚国防部116页报告

专知

178+阅读 · 2022年9月19日

2022人工智能十大关键词: 从大模型到可信落地，附人工智能白皮书下载

2022人工智能十大关键词: 从大模型到可信落地，附人工智能白皮书下载

专知

10+阅读 · 2022年8月18日

重磅！最新《人工智能白皮书（2022年）》发布，42页pdf

重磅！最新《人工智能白皮书（2022年）》发布，42页pdf

专知

25+阅读 · 2022年4月13日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

重磅！AI框架发展白皮书（2022年）,44页pdf

重磅！AI框架发展白皮书（2022年）,44页pdf

专知

28+阅读 · 2022年2月27日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

【MIT重磅】人工智能新技术综述：数据、算法、人机协作

【MIT重磅】人工智能新技术综述：数据、算法、人机协作

专知

13+阅读 · 2019年5月11日

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

超越标准 GNN ！DeepMind、谷歌提出图匹配网络| ICML最新论文

新智元

20+阅读 · 2019年5月6日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

Beyond Benchmark Islands: Toward Representative Trustworthiness Evaluation for Agentic AI

Arxiv

0+阅读 · 3月16日

HyperParallel: A Supernode-Affinity AI Framework

Arxiv

0+阅读 · 3月4日

From Dyads to Groups: Rethinking Emotional Support with Conversational AI

Arxiv

0+阅读 · 2月28日

Beyond Mimicry to Contextual Guidance: Knowledge Distillation for Interactive AI

Arxiv

0+阅读 · 2月20日

Exposing the Systematic Vulnerability of Open-Weight Models to Prefill Attacks

Arxiv

0+阅读 · 2月16日

StackingNet: Collective Inference Across Independent AI Foundation Models

Arxiv

0+阅读 · 2月14日

Beyond Input-Output: Rethinking Creativity through Design-by-Analogy in Human-AI Collaboration

Arxiv

0+阅读 · 2月10日

Towards Cybersecurity Superintelligence: from AI-guided humans to human-guided AI

Arxiv

0+阅读 · 2月9日

Artificial Intelligence in Open Source Software Engineering: A Foundation for Sustainability

Arxiv

0+阅读 · 2月5日

Beyond Retrieval: A Modular Benchmark for Academic Deep Research Agents

Arxiv

0+阅读 · 1月30日

相关基金

战略构想、知识搜寻与双元导向下企业技术创新能力演进：基于适应性演进和协同视角

国家自然科学基金

2+阅读 · 2015年12月31日

面向智能穿戴设备的三维图形网格简化与渐进显示方法

国家自然科学基金

1+阅读 · 2015年12月31日

软件定义开放光接入网理论模型和控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

创新如何开放：基于组织控制的研究

国家自然科学基金

3+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

领导行为作用下技术二元创新与商业模式匹配机理研究

国家自然科学基金

1+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员