Navigating Uncertainties: How GenAI Developers Document Their Models on Open-Source Platforms - 专知论文

会员服务 ·

0

不确定 · 不确定性 · AI模型 · 人工智能系统 · 系统 ·

Navigating Uncertainties: How GenAI Developers Document Their Models on Open-Source Platforms

翻译：在不确定性中前行：GenAI开发者如何在开源平台上记录其模型

Ningjing Tang,Megan Li,Amy Winecoff,Michael Madaio,Hoda Heidari,Hong Shen

from arxiv, Conditionally accepted at CHI 2026

Model documentation plays a crucial role in promoting transparency and responsible development of AI systems. With the rise of Generative AI (GenAI), open-source platforms have increasingly become hubs for hosting and distributing these models, prompting platforms like Hugging Face to develop dedicated model documentation guidelines that align with responsible AI principles. Despite these growing efforts, there remains a lack of understanding of how developers document their GenAI models on open-source platforms. Through interviews with 13 GenAI developers active on open-source platforms, we provide empirical insights into their documentation practices and challenges. Our analysis reveals that despite existing resources, developers of GenAI models still face multiple layers of uncertainties in their model documentation: (1) uncertainties about what specific content should be included; (2) uncertainties about how to effectively report key components of their models; and (3) uncertainties in deciding who should take responsibilities for various aspects of model documentation. Based on our findings, we discuss the implications for policymakers, open-source platforms, and the research community to support meaningful, effective and actionable model documentation in the GenAI era, including cultivating better community norms, building robust evaluation infrastructures, and clarifying roles and responsibilities.

翻译：模型文档在促进人工智能系统的透明度和负责任开发方面发挥着至关重要的作用。随着生成式人工智能的兴起，开源平台日益成为托管和分发此类模型的中心，促使Hugging Face等平台制定了符合负责任AI原则的专用模型文档指南。尽管相关努力不断增长，但人们对于开发者如何在开源平台上记录其GenAI模型仍缺乏了解。通过对13位活跃于开源平台的GenAI开发者进行访谈，我们对其文档实践与挑战提供了实证性见解。我们的分析表明，尽管存在现有资源，GenAI模型的开发者在模型文档记录中仍面临多重不确定性：(1) 不确定应包含哪些具体内容；(2) 不确定如何有效报告模型的关键组成部分；(3) 不确定应由谁承担模型文档各方面责任。基于研究发现，我们讨论了研究结果对政策制定者、开源平台及研究社区的启示，以支持在GenAI时代建立有意义、有效且可操作的模型文档，包括培育更完善的社区规范、构建稳健的评估基础设施以及明确角色与责任。

0

相关内容

不确定

【Hugging Face】开源视频生成模型的发展现状，31页ppt

【Hugging Face】开源视频生成模型的发展现状，31页ppt

专知会员服务

18+阅读 · 2025年8月30日

《人工智能模型风险目录：开发者与研究者对现实世界AI危害的认知盲区》

《人工智能模型风险目录：开发者与研究者对现实世界AI危害的认知盲区》

专知会员服务

17+阅读 · 2025年8月28日

【CMU博士论文】通过对不完美数据的稳健理解与学习推动基础模型的民主化

【CMU博士论文】通过对不完美数据的稳健理解与学习推动基础模型的民主化

专知会员服务

11+阅读 · 2025年5月21日

中文版 | 生成式人工智能（GenAI）：概览、议题与美国国会考量

中文版 | 生成式人工智能（GenAI）：概览、议题与美国国会考量

专知会员服务

23+阅读 · 2025年4月15日

《GenAI技术落地白皮书》，19页

《GenAI技术落地白皮书》，19页

专知会员服务

58+阅读 · 2024年6月23日

Sora之后，OpenAI Lilian Weng亲自撰文教你从头设计《视频生成扩散模型》

Sora之后，OpenAI Lilian Weng亲自撰文教你从头设计《视频生成扩散模型》

专知会员服务

22+阅读 · 2024年4月22日

《多模态大型语言模型进化》最新综述

《多模态大型语言模型进化》最新综述

专知会员服务

105+阅读 · 2024年2月23日

谷歌开源模型系列「Gemma」技术报告，中英文版

谷歌开源模型系列「Gemma」技术报告，中英文版

专知会员服务

47+阅读 · 2024年2月22日

生成式AI如何可控？谷歌DARPA等最新《识别并缓解生成式人工智能的安全风险》综述，详述GenAI技术安全性

生成式AI如何可控？谷歌DARPA等最新《识别并缓解生成式人工智能的安全风险》综述，详述GenAI技术安全性

专知会员服务

48+阅读 · 2023年9月20日

AI系统如何可信？CMU-Nicholas博士论文《以模型为中心的人工智能验证》200页阐述增强AI系统信任度以确保安全部署运行

AI系统如何可信？CMU-Nicholas博士论文《以模型为中心的人工智能验证》200页阐述增强AI系统信任度以确保安全部署运行

专知会员服务

67+阅读 · 2022年1月27日

【Hugging Face硬核书】Transformer自然语言处理(Hugging Face)：构建语言应用

【Hugging Face硬核书】Transformer自然语言处理(Hugging Face)：构建语言应用

专知

34+阅读 · 2022年4月7日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

基于Hugging Face的Transformer库，300行实现命名实体识别

基于Hugging Face的Transformer库，300行实现命名实体识别

专知

119+阅读 · 2020年2月25日

深度学习模型不确定性方法对比

深度学习模型不确定性方法对比

PaperWeekly

20+阅读 · 2020年2月10日

100+前沿“拿来即用”开源深度学习模型汇总分享

100+前沿“拿来即用”开源深度学习模型汇总分享

深度学习与NLP

11+阅读 · 2019年8月29日

一文看懂AutoEncoder模型演进图谱

一文看懂AutoEncoder模型演进图谱

AINLP

12+阅读 · 2019年6月17日

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

机器之心

15+阅读 · 2019年2月13日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

AI研习社

13+阅读 · 2018年6月8日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于量子模糊承诺体系的生物身份认证系统研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多源异构不确定数据的高效用信息挖掘的研究

国家自然科学基金

4+阅读 · 2015年12月31日

可证明安全的确定性公钥加密体制研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

模仿型新产品开发过程及对新产品绩效的影响机制：中、美、印的跨国研究

国家自然科学基金

0+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

Development of Ontological Knowledge Bases by Leveraging Large Language Models

Arxiv

0+阅读 · 3月13日

A LINDDUN-based Privacy Threat Modeling Framework for GenAI

Arxiv

0+阅读 · 3月6日

Policy or Community?: Supporting Individual Model Creators' Open Model Development in Model Marketplaces

Arxiv

0+阅读 · 2月22日

Tutoring Large Language Models to be Domain-adaptive, Precise, and Safe

Arxiv

0+阅读 · 2月14日

Evaluating Kubernetes Performance for GenAI Inference: From Automatic Speech Recognition to LLM Summarization

Arxiv

0+阅读 · 2月11日

Drawing Your Programs: Exploring the Applications of Visual-Prompting with GenAI for Teaching and Assessment

Arxiv

0+阅读 · 2月11日

Forecasting Developer Environments with GenAI: A Research Perspective

Arxiv

0+阅读 · 2月7日

Large Language Models in Software Documentation and Modeling: A Literature Review and Findings

Arxiv

0+阅读 · 2月4日

Evaluating Kubernetes Performance for GenAI Inference: From Automatic Speech Recognition to LLM Summarization

Arxiv

0+阅读 · 2月3日

"I'm happy even though it's not real": GenAI Photo Editing as a Remembering Experience

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

人工智能系统

最新内容

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

1+阅读 · 今天3:12

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

1+阅读 · 今天3:00

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

1+阅读 · 今天2:56

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

1+阅读 · 今天2:44

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

2+阅读 · 今天2:37

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

专知会员服务

1+阅读 · 今天2:22

美海军“超配项目”

美海军“超配项目”

专知会员服务

1+阅读 · 今天2:13

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

10+阅读 · 4月21日

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

12+阅读 · 4月21日

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

7+阅读 · 4月21日

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

8+阅读 · 4月21日

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

10+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

相关VIP内容

【Hugging Face】开源视频生成模型的发展现状，31页ppt

【Hugging Face】开源视频生成模型的发展现状，31页ppt

专知会员服务

18+阅读 · 2025年8月30日

《人工智能模型风险目录：开发者与研究者对现实世界AI危害的认知盲区》

《人工智能模型风险目录：开发者与研究者对现实世界AI危害的认知盲区》

专知会员服务

17+阅读 · 2025年8月28日

【CMU博士论文】通过对不完美数据的稳健理解与学习推动基础模型的民主化

【CMU博士论文】通过对不完美数据的稳健理解与学习推动基础模型的民主化

专知会员服务

11+阅读 · 2025年5月21日

中文版 | 生成式人工智能（GenAI）：概览、议题与美国国会考量

中文版 | 生成式人工智能（GenAI）：概览、议题与美国国会考量

专知会员服务

23+阅读 · 2025年4月15日

《GenAI技术落地白皮书》，19页

《GenAI技术落地白皮书》，19页

专知会员服务

58+阅读 · 2024年6月23日

Sora之后，OpenAI Lilian Weng亲自撰文教你从头设计《视频生成扩散模型》

Sora之后，OpenAI Lilian Weng亲自撰文教你从头设计《视频生成扩散模型》

专知会员服务

22+阅读 · 2024年4月22日

《多模态大型语言模型进化》最新综述

《多模态大型语言模型进化》最新综述

专知会员服务

105+阅读 · 2024年2月23日

谷歌开源模型系列「Gemma」技术报告，中英文版

谷歌开源模型系列「Gemma」技术报告，中英文版

专知会员服务

47+阅读 · 2024年2月22日

生成式AI如何可控？谷歌DARPA等最新《识别并缓解生成式人工智能的安全风险》综述，详述GenAI技术安全性

生成式AI如何可控？谷歌DARPA等最新《识别并缓解生成式人工智能的安全风险》综述，详述GenAI技术安全性

专知会员服务

48+阅读 · 2023年9月20日

AI系统如何可信？CMU-Nicholas博士论文《以模型为中心的人工智能验证》200页阐述增强AI系统信任度以确保安全部署运行

AI系统如何可信？CMU-Nicholas博士论文《以模型为中心的人工智能验证》200页阐述增强AI系统信任度以确保安全部署运行

专知会员服务

67+阅读 · 2022年1月27日

热门VIP内容

开通专知VIP会员享更多权益服务

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

大语言模型平台在国防情报应用中的对比

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

相关资讯

【Hugging Face硬核书】Transformer自然语言处理(Hugging Face)：构建语言应用

【Hugging Face硬核书】Transformer自然语言处理(Hugging Face)：构建语言应用

专知

34+阅读 · 2022年4月7日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

基于Hugging Face的Transformer库，300行实现命名实体识别

基于Hugging Face的Transformer库，300行实现命名实体识别

专知

119+阅读 · 2020年2月25日

深度学习模型不确定性方法对比

深度学习模型不确定性方法对比

PaperWeekly

20+阅读 · 2020年2月10日

100+前沿“拿来即用”开源深度学习模型汇总分享

100+前沿“拿来即用”开源深度学习模型汇总分享

深度学习与NLP

11+阅读 · 2019年8月29日

一文看懂AutoEncoder模型演进图谱

一文看懂AutoEncoder模型演进图谱

AINLP

12+阅读 · 2019年6月17日

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

机器之心

15+阅读 · 2019年2月13日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

AI研习社

13+阅读 · 2018年6月8日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

相关论文

Development of Ontological Knowledge Bases by Leveraging Large Language Models

Arxiv

0+阅读 · 3月13日

A LINDDUN-based Privacy Threat Modeling Framework for GenAI

Arxiv

0+阅读 · 3月6日

Policy or Community?: Supporting Individual Model Creators' Open Model Development in Model Marketplaces

Arxiv

0+阅读 · 2月22日

Tutoring Large Language Models to be Domain-adaptive, Precise, and Safe

Arxiv

0+阅读 · 2月14日

Evaluating Kubernetes Performance for GenAI Inference: From Automatic Speech Recognition to LLM Summarization

Arxiv

0+阅读 · 2月11日

Drawing Your Programs: Exploring the Applications of Visual-Prompting with GenAI for Teaching and Assessment

Arxiv

0+阅读 · 2月11日

Forecasting Developer Environments with GenAI: A Research Perspective

Arxiv

0+阅读 · 2月7日

Large Language Models in Software Documentation and Modeling: A Literature Review and Findings

Arxiv

0+阅读 · 2月4日

Evaluating Kubernetes Performance for GenAI Inference: From Automatic Speech Recognition to LLM Summarization

Arxiv

0+阅读 · 2月3日

"I'm happy even though it's not real": GenAI Photo Editing as a Remembering Experience

Arxiv

0+阅读 · 2月3日

相关基金

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于量子模糊承诺体系的生物身份认证系统研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多源异构不确定数据的高效用信息挖掘的研究

国家自然科学基金

4+阅读 · 2015年12月31日

可证明安全的确定性公钥加密体制研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

模仿型新产品开发过程及对新产品绩效的影响机制：中、美、印的跨国研究

国家自然科学基金

0+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员