If open source is to win, it must go public - 专知论文

会员服务 ·

0

构建 · 软件 · AI · AI模型 · 学习模型 ·

If open source is to win, it must go public

翻译：如果开源要取得成功，就必须走向公共化

Joshua Tan,Nicholas Vincent,Katherine Elkins,Magnus Sahlgren,Joseph Low,David Pham,Sampo Pyysalo,Jenia Jitsev

from arxiv, ICML 2026 Spotlight

Open source projects have made incredible progress in producing widely usable machine learning models and systems, but open source alone will face challenges in fully democratizing access to AI. Unlike previous generations of open source software, open source and open weight AI models require substantial resources to activate and maintain -- e.g., data and compute for pre-training, post-training, and deployment -- which only a few actors can currently provide. This position paper argues that open source AI must be complemented by public AI: infrastructure and institutions that ensure models are accessible, sustainable, and governed in the public interest. To achieve the full promise of AI models as prosocial public goods, we need to build public infrastructure to power and deliver open source software and models.

翻译：开源项目在构建广泛可用的机器学习模型与系统方面取得了令人瞩目的进展，但仅凭开源本身，将面临实现人工智能全面民主化普及的挑战。与以往几代开源软件不同，开源及开放权重的AI模型需要大量资源来激活与维护——例如用于预训练、后训练及部署的数据与算力——而目前仅有少数行动者能够提供这些资源。本立场论文提出，开源人工智能必须由公共人工智能加以补充：即确保模型以公共利益为导向、具有可及性、可持续性并接受治理的基础设施与制度体系。为实现AI模型作为亲社会性公共物品的全部潜力，我们需要构建能够驱动并交付开源软件与模型的公共基础设施。

0

相关内容

《开源大模型应用指南1.0》正式发布，85页pdf

《开源大模型应用指南1.0》正式发布，85页pdf

专知会员服务

78+阅读 · 2024年12月4日

智能化软件开发落地实践指南（2024年），58页pdf

智能化软件开发落地实践指南（2024年），58页pdf

专知会员服务

59+阅读 · 2024年10月3日

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

专知会员服务

46+阅读 · 2024年9月17日

人工智能开源大模型生态研究

人工智能开源大模型生态研究

专知会员服务

65+阅读 · 2024年8月16日

Meta Llama 3.1 405B 正式发布发布，Llama成大模型顶流，扎克伯格掀论战：玩开源，时代变了

Meta Llama 3.1 405B 正式发布发布，Llama成大模型顶流，扎克伯格掀论战：玩开源，时代变了

专知会员服务

19+阅读 · 2024年7月24日

大模型报告:模型能力决定下限，场景适配度决定上限

大模型报告:模型能力决定下限，场景适配度决定上限

专知会员服务

57+阅读 · 2024年6月3日

【中国联通】AI隐私泄露危机四伏！如何确保数据安全？《人工智能隐私保护白皮书》揭示AI隐私风险与应对策略（附下载），45页pdf

【中国联通】AI隐私泄露危机四伏！如何确保数据安全？《人工智能隐私保护白皮书》揭示AI隐私风险与应对策略（附下载），45页pdf

专知会员服务

51+阅读 · 2023年12月10日

《全球开源生态研究报告（2022年）》发布，48页pdf

《全球开源生态研究报告（2022年）》发布，48页pdf

专知会员服务

39+阅读 · 2022年9月19日

开源生态白皮书，47页pdf

专知会员服务

59+阅读 · 2021年9月23日

智源发布《2020北京人工智能发展报告》，附43页pdf

智源发布《2020北京人工智能发展报告》，附43页pdf

专知会员服务

128+阅读 · 2020年11月19日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

完备的 AI 学习路线，最详细的资源整理！

完备的 AI 学习路线，最详细的资源整理！

新智元

18+阅读 · 2019年5月4日

资源 | GitHub 干货 —— 各大数据竞赛 Top 解决方案开源

资源 | GitHub 干货 —— 各大数据竞赛 Top 解决方案开源

AI科技评论

17+阅读 · 2019年1月27日

数学是普通程序员入门人工智能的最大障碍

数学是普通程序员入门人工智能的最大障碍

算法与数据结构

12+阅读 · 2018年7月27日

中国人工智能三年国家战略公布：8类产品要火

中国人工智能三年国家战略公布：8类产品要火

千读

12+阅读 · 2017年12月20日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

资源 | 清华大学开源OpenKE：知识表示学习平台

资源 | 清华大学开源OpenKE：知识表示学习平台

机器之心

10+阅读 · 2017年11月4日

Representation Learning on Network 网络表示学习

Representation Learning on Network 网络表示学习

全球人工智能

10+阅读 · 2017年10月19日

全解：目标检测，图像分类、分割、生成……

全解：目标检测，图像分类、分割、生成……

全球人工智能

20+阅读 · 2017年9月15日

RCNN, Fast-RCNN, Faster-RCNN那些你必须知道的事！

RCNN, Fast-RCNN, Faster-RCNN那些你必须知道的事！

全球人工智能

10+阅读 · 2017年8月18日

超大规模约束优化问题算法及其应用天元数学交流项目

国家自然科学基金

2+阅读 · 2017年12月31日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

可证明安全的确定性公钥加密体制研究

国家自然科学基金

0+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

基于众包的群体智慧涌现及创新效应研究

国家自然科学基金

3+阅读 · 2014年12月31日

社会化媒体中基于群体智慧的知识萃取、组织与服务

国家自然科学基金

0+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

大规模在线社会网络社区发现及隐私保护研究

国家自然科学基金

1+阅读 · 2014年12月31日

大数据商业模式、产业链治理及公共政策研究

国家自然科学基金

12+阅读 · 2013年12月31日

If open source is to win, it must go public

Arxiv

0+阅读 · 6月13日

Regulating the Machine Contributor: Governance and Policy Alignment in Open Source

Arxiv

0+阅读 · 6月12日

Reimagining Open Source and Openness in AI: Co-Creating Responsible Technological Futures

Arxiv

0+阅读 · 6月5日

Public Sector Open Source Program Offices -- Archetypes for how to Grow (Common) Institutional Capabilities

Arxiv

0+阅读 · 6月4日

Advancing Digital Government: Integrating Open Source Software Enablement Indicators in Maturity Indexes

Arxiv

0+阅读 · 6月4日

Focused on the User, Overlooking the Risks: Security and Privacy Understandings, Practices and Challenges of Independent Chinese AI Agent Developers

Arxiv

0+阅读 · 6月2日

Orchard: An Open-Source Agentic Modeling Framework

Arxiv

0+阅读 · 5月21日

An Overview of Cyber Security Funding for Open Source Software

Arxiv

0+阅读 · 5月15日

Personalized Deep Research: A User-Centric Framework, Dataset, and Hybrid Evaluation for Knowledge Discovery

Arxiv

0+阅读 · 5月11日

Going Public: Communication in Collective Decisions

Arxiv

0+阅读 · 5月5日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

《开源大模型应用指南1.0》正式发布，85页pdf

《开源大模型应用指南1.0》正式发布，85页pdf

专知会员服务

78+阅读 · 2024年12月4日

智能化软件开发落地实践指南（2024年），58页pdf

智能化软件开发落地实践指南（2024年），58页pdf

专知会员服务

59+阅读 · 2024年10月3日

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

专知会员服务

46+阅读 · 2024年9月17日

人工智能开源大模型生态研究

人工智能开源大模型生态研究

专知会员服务

65+阅读 · 2024年8月16日

Meta Llama 3.1 405B 正式发布发布，Llama成大模型顶流，扎克伯格掀论战：玩开源，时代变了

Meta Llama 3.1 405B 正式发布发布，Llama成大模型顶流，扎克伯格掀论战：玩开源，时代变了

专知会员服务

19+阅读 · 2024年7月24日

大模型报告:模型能力决定下限，场景适配度决定上限

大模型报告:模型能力决定下限，场景适配度决定上限

专知会员服务

57+阅读 · 2024年6月3日

【中国联通】AI隐私泄露危机四伏！如何确保数据安全？《人工智能隐私保护白皮书》揭示AI隐私风险与应对策略（附下载），45页pdf

【中国联通】AI隐私泄露危机四伏！如何确保数据安全？《人工智能隐私保护白皮书》揭示AI隐私风险与应对策略（附下载），45页pdf

专知会员服务

51+阅读 · 2023年12月10日

《全球开源生态研究报告（2022年）》发布，48页pdf

《全球开源生态研究报告（2022年）》发布，48页pdf

专知会员服务

39+阅读 · 2022年9月19日

开源生态白皮书，47页pdf

专知会员服务

59+阅读 · 2021年9月23日

智源发布《2020北京人工智能发展报告》，附43页pdf

智源发布《2020北京人工智能发展报告》，附43页pdf

专知会员服务

128+阅读 · 2020年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

完备的 AI 学习路线，最详细的资源整理！

完备的 AI 学习路线，最详细的资源整理！

新智元

18+阅读 · 2019年5月4日

资源 | GitHub 干货 —— 各大数据竞赛 Top 解决方案开源

资源 | GitHub 干货 —— 各大数据竞赛 Top 解决方案开源

AI科技评论

17+阅读 · 2019年1月27日

数学是普通程序员入门人工智能的最大障碍

数学是普通程序员入门人工智能的最大障碍

算法与数据结构

12+阅读 · 2018年7月27日

中国人工智能三年国家战略公布：8类产品要火

中国人工智能三年国家战略公布：8类产品要火

千读

12+阅读 · 2017年12月20日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

资源 | 清华大学开源OpenKE：知识表示学习平台

资源 | 清华大学开源OpenKE：知识表示学习平台

机器之心

10+阅读 · 2017年11月4日

Representation Learning on Network 网络表示学习

Representation Learning on Network 网络表示学习

全球人工智能

10+阅读 · 2017年10月19日

全解：目标检测，图像分类、分割、生成……

全解：目标检测，图像分类、分割、生成……

全球人工智能

20+阅读 · 2017年9月15日

RCNN, Fast-RCNN, Faster-RCNN那些你必须知道的事！

RCNN, Fast-RCNN, Faster-RCNN那些你必须知道的事！

全球人工智能

10+阅读 · 2017年8月18日

相关论文

If open source is to win, it must go public

Arxiv

0+阅读 · 6月13日

Regulating the Machine Contributor: Governance and Policy Alignment in Open Source

Arxiv

0+阅读 · 6月12日

Reimagining Open Source and Openness in AI: Co-Creating Responsible Technological Futures

Arxiv

0+阅读 · 6月5日

Public Sector Open Source Program Offices -- Archetypes for how to Grow (Common) Institutional Capabilities

Arxiv

0+阅读 · 6月4日

Advancing Digital Government: Integrating Open Source Software Enablement Indicators in Maturity Indexes

Arxiv

0+阅读 · 6月4日

Focused on the User, Overlooking the Risks: Security and Privacy Understandings, Practices and Challenges of Independent Chinese AI Agent Developers

Arxiv

0+阅读 · 6月2日

Orchard: An Open-Source Agentic Modeling Framework

Arxiv

0+阅读 · 5月21日

An Overview of Cyber Security Funding for Open Source Software

Arxiv

0+阅读 · 5月15日

Personalized Deep Research: A User-Centric Framework, Dataset, and Hybrid Evaluation for Knowledge Discovery

Arxiv

0+阅读 · 5月11日

Going Public: Communication in Collective Decisions

Arxiv

0+阅读 · 5月5日

相关基金

超大规模约束优化问题算法及其应用天元数学交流项目

国家自然科学基金

2+阅读 · 2017年12月31日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

可证明安全的确定性公钥加密体制研究

国家自然科学基金

0+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

基于众包的群体智慧涌现及创新效应研究

国家自然科学基金

3+阅读 · 2014年12月31日

社会化媒体中基于群体智慧的知识萃取、组织与服务

国家自然科学基金

0+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

大规模在线社会网络社区发现及隐私保护研究

国家自然科学基金

1+阅读 · 2014年12月31日

大数据商业模式、产业链治理及公共政策研究

国家自然科学基金

12+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员