Constructing BERT Models: How Team Dynamics and Focus Shape AI Model Impact - 专知论文

会员服务 ·

0

BERT · AI · 构建 · 塑造 · AI研究 ·

Constructing BERT Models: How Team Dynamics and Focus Shape AI Model Impact

翻译：构建BERT模型：团队动态与专注领域如何塑造AI模型影响力

Likun Cao,Kai Li

from arxiv, The paper has been accepted by Quantitative Science Studies

The rapid evolution of AI technologies, exemplified by BERT-family models, has transformed scientific research, yet little is known about their production and recognition dynamics in the scientific system. This study investigates the development and impact of BERT-family models, focusing on team size, topic specialization, and citation patterns behind the models. Using a dataset of 4,208 BERT-related papers from the Papers with Code (PWC) dataset, we analyze how the BERT-family models evolve across methodological generations and how the newness of models is correlated with their production and recognition. Our findings reveal that newer BERT models are developed by larger, more experienced, and institutionally diverse teams, reflecting the increasing complexity of AI research. Additionally, these models exhibit greater topical specialization, targeting niche applications, which aligns with broader trends in scientific specialization. However, newer models receive fewer citations, particularly over the long term, suggesting a "first-mover advantage," where early models like BERT garner disproportionate recognition. These insights highlight the need for equitable evaluation frameworks that value both foundational and incremental innovations. This study underscores the evolving interplay between collaboration, specialization, and recognition in AI research.

翻译：以BERT系列模型为代表的AI技术快速发展已彻底改变了科学研究，然而科学体系中这些模型的生产与认可机制仍鲜为人知。本研究通过分析模型背后的团队规模、主题专业化和引用模式，深入探讨BERT系列模型的开发历程与学术影响。基于Papers with Code（PWC）数据集中4,208篇BERT相关论文，我们追踪了BERT系列模型在方法学代际间的演进路径，并探究模型新颖性与其生产及认可度的关联。研究发现：较新的BERT模型由规模更大、经验更丰富且机构多元化的团队开发，这反映了AI研究日益增长的复杂性；同时这些模型展现出更强的主题专业化倾向，专注于细分领域应用，这与科学领域普遍的专业化趋势相符。然而较新模型获得的引用量更少（长期表现尤为明显），暗示着"先发优势"的存在——早期模型（如原始BERT）获得了不成比例的学术认可。这些发现表明，需要建立更均衡的评估体系以同时重视基础性突破与渐进式创新。本研究揭示了AI研究中合作模式、专业化程度与学术认可之间不断演变的互动关系。

0

相关内容

BERT

BERT全称Bidirectional Encoder Representations from Transformers，是预训练语言表示的方法，可以在大型文本语料库（如维基百科）上训练通用的“语言理解”模型，然后将该模型用于下游NLP任务，比如机器翻译、问答。

【新书】Transformer、BERT和GPT: 包括ChatGPT和提示工程，379页pdf

【新书】Transformer、BERT和GPT: 包括ChatGPT和提示工程，379页pdf

专知会员服务

49+阅读 · 2024年4月21日

BERT、GPT-3等预训练模型大一统？斯坦福Percy Liang、李飞飞等114位作者发布212页综述，阐述大模型机遇与风险

BERT、GPT-3等预训练模型大一统？斯坦福Percy Liang、李飞飞等114位作者发布212页综述，阐述大模型机遇与风险

专知会员服务

69+阅读 · 2021年8月19日

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

专知会员服务

91+阅读 · 2020年4月6日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知会员服务

140+阅读 · 2020年3月1日

BERT到底如何work的？A Primer in BERTology: What we know about how BERT works

BERT到底如何work的？A Primer in BERTology: What we know about how BERT works

专知会员服务

50+阅读 · 2020年2月28日

【清华大学】Bert 简介，Bidirectional Encoder Representations from Transformers，21页ppt

【清华大学】Bert 简介，Bidirectional Encoder Representations from Transformers，21页ppt

专知会员服务

79+阅读 · 2019年12月29日

【开放书】预测模型:探索、解释和调试，以人为本的可解释机器学习，Predictive Models: Explore, Explain, and Debug，Human-Centered Interpretable Machine Learning

【开放书】预测模型:探索、解释和调试，以人为本的可解释机器学习，Predictive Models: Explore, Explain, and Debug，Human-Centered Interpretable Machine Learning

专知会员服务

37+阅读 · 2019年12月26日

【Google论文强烈推荐】ALBERT:基于精简BERT的自我监督学习的语言表示，ALBERT: A Lite BERT for Self-Supervised Learning of Language Representations

【Google论文强烈推荐】ALBERT:基于精简BERT的自我监督学习的语言表示，ALBERT: A Lite BERT for Self-Supervised Learning of Language Representations

专知会员服务

24+阅读 · 2019年12月21日

【论文推荐】基于BERT修剪的问答模型（Pruning a BERT-based Question Answering Model）

【论文推荐】基于BERT修剪的问答模型（Pruning a BERT-based Question Answering Model）

专知会员服务

30+阅读 · 2019年11月22日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

3倍加速CPU上的BERT模型部署

3倍加速CPU上的BERT模型部署

ApacheMXNet

11+阅读 · 2020年7月13日

8篇论文梳理BERT相关模型进展与反思 | MSRA出品

8篇论文梳理BERT相关模型进展与反思 | MSRA出品

量子位

11+阅读 · 2019年9月15日

【GitHub】BERT模型从训练到部署全流程

【GitHub】BERT模型从训练到部署全流程

专知

34+阅读 · 2019年6月28日

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

专知

20+阅读 · 2019年6月27日

深入理解BERT Transformer ，不仅仅是注意力机制

深入理解BERT Transformer ，不仅仅是注意力机制

大数据文摘

22+阅读 · 2019年3月19日

使用 Bert 预训练模型文本分类（内附源码）

使用 Bert 预训练模型文本分类（内附源码）

数据库开发

102+阅读 · 2019年3月12日

Perseus-BERT——业内性能极致优化的BERT训练方案

Perseus-BERT——业内性能极致优化的BERT训练方案

云栖社区

15+阅读 · 2019年2月20日

AI赋能法律 | NLP最强之谷歌BERT模型在智能司法领域的实践浅谈

AI赋能法律 | NLP最强之谷歌BERT模型在智能司法领域的实践浅谈

AINLP

24+阅读 · 2018年11月30日

最强NLP模型BERT喜迎PyTorch版！谷歌官方推荐，也会支持中文

最强NLP模型BERT喜迎PyTorch版！谷歌官方推荐，也会支持中文

量子位

13+阅读 · 2018年11月7日

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

AINLP

12+阅读 · 2018年11月1日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于多种网络模型的舆论领袖识别及其传播影响力仿真研究

国家自然科学基金

1+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向构建过程的范畴学习模型及其适应性机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

模仿型新产品开发过程及对新产品绩效的影响机制：中、美、印的跨国研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于构件的可信软件构造及其行为动态可信测评

国家自然科学基金

1+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

Model Medicine: A Clinical Framework for Understanding, Diagnosing, and Treating AI Models

Arxiv

0+阅读 · 3月17日

TriTopic: Tri-Modal Graph-Based Topic Modeling with Iterative Refinement and Archetypes

Arxiv

0+阅读 · 2月22日

Agent Skill Framework: Perspectives on the Potential of Small Language Models in Industrial Environments

Arxiv

0+阅读 · 2月20日

Mining Type Constructs Using Patterns in AI-Generated Code

Arxiv

0+阅读 · 2月20日

Agent Skill Framework: Perspectives on the Potential of Small Language Models in Industrial Environments

Arxiv

0+阅读 · 2月18日

Developing AI Agents with Simulated Data: Why, what, and how?

Arxiv

0+阅读 · 2月17日

AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises

Arxiv

2+阅读 · 2月16日

Impacts of Generative AI on Agile Teams' Productivity: A Multi-Case Longitudinal Study

Arxiv

0+阅读 · 2月14日

Differentiable Modal Logic for Multi-Agent Diagnosis, Orchestration and Communication

Arxiv

0+阅读 · 2月12日

Collaborating with AI Agents: Field Experiments on Teamwork, Productivity, and Performance

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

算法战加速推进：五角大楼项目、供应商生态体系与军事创新的战略重塑

算法战加速推进：五角大楼项目、供应商生态体系与军事创新的战略重塑

专知会员服务

0+阅读 · 19分钟前

探秘Palantir：驱动美情报的科技巨头

探秘Palantir：驱动美情报的科技巨头

专知会员服务

0+阅读 · 28分钟前

《从技术突破到战场应用：发挥原型开发效能的最佳实践》报告

《从技术突破到战场应用：发挥原型开发效能的最佳实践》报告

专知会员服务

1+阅读 · 33分钟前

《美国海军军事海运司令部 2026年手册》

《美国海军军事海运司令部 2026年手册》

专知会员服务

0+阅读 · 37分钟前

别再只盯着“杀手机器人”了：人工智能真正变革现代战争的三种方式

别再只盯着“杀手机器人”了：人工智能真正变革现代战争的三种方式

专知会员服务

0+阅读 · 今天2:36

《人工智能使能系统可靠性框架》

《人工智能使能系统可靠性框架》

专知会员服务

1+阅读 · 今天2:28

2026“人工智能+”行业发展蓝皮书（附下载）

2026“人工智能+”行业发展蓝皮书（附下载）

专知会员服务

10+阅读 · 4月26日

《强化学习数学基础》

《强化学习数学基础》

专知会员服务

7+阅读 · 4月26日

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

专知会员服务

7+阅读 · 4月26日

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

专知会员服务

5+阅读 · 4月26日

深入Maven智能系统：Palantir基于Claude打造的军事大脑

深入Maven智能系统：Palantir基于Claude打造的军事大脑

专知会员服务

12+阅读 · 4月26日

“Maven计划”的发展演变之“Maven智能系统”应用

“Maven计划”的发展演变之“Maven智能系统”应用

专知会员服务

10+阅读 · 4月26日

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

专知会员服务

7+阅读 · 4月26日

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

专知会员服务

7+阅读 · 4月26日

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

专知会员服务

6+阅读 · 4月26日

相关VIP内容

【新书】Transformer、BERT和GPT: 包括ChatGPT和提示工程，379页pdf

【新书】Transformer、BERT和GPT: 包括ChatGPT和提示工程，379页pdf

专知会员服务

49+阅读 · 2024年4月21日

BERT、GPT-3等预训练模型大一统？斯坦福Percy Liang、李飞飞等114位作者发布212页综述，阐述大模型机遇与风险

BERT、GPT-3等预训练模型大一统？斯坦福Percy Liang、李飞飞等114位作者发布212页综述，阐述大模型机遇与风险

专知会员服务

69+阅读 · 2021年8月19日

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

Google BERT作者Jacob斯坦福亲授《上下文词向量与预训练语言模型: BERT到T5》43页ppt

专知会员服务

91+阅读 · 2020年4月6日

BERT技术体系综述论文：40项分析探究BERT如何work

BERT技术体系综述论文：40项分析探究BERT如何work

专知会员服务

140+阅读 · 2020年3月1日

BERT到底如何work的？A Primer in BERTology: What we know about how BERT works

BERT到底如何work的？A Primer in BERTology: What we know about how BERT works

专知会员服务

50+阅读 · 2020年2月28日

【清华大学】Bert 简介，Bidirectional Encoder Representations from Transformers，21页ppt

【清华大学】Bert 简介，Bidirectional Encoder Representations from Transformers，21页ppt

专知会员服务

79+阅读 · 2019年12月29日

【开放书】预测模型:探索、解释和调试，以人为本的可解释机器学习，Predictive Models: Explore, Explain, and Debug，Human-Centered Interpretable Machine Learning

【开放书】预测模型:探索、解释和调试，以人为本的可解释机器学习，Predictive Models: Explore, Explain, and Debug，Human-Centered Interpretable Machine Learning

专知会员服务

37+阅读 · 2019年12月26日

【Google论文强烈推荐】ALBERT:基于精简BERT的自我监督学习的语言表示，ALBERT: A Lite BERT for Self-Supervised Learning of Language Representations

【Google论文强烈推荐】ALBERT:基于精简BERT的自我监督学习的语言表示，ALBERT: A Lite BERT for Self-Supervised Learning of Language Representations

专知会员服务

24+阅读 · 2019年12月21日

【论文推荐】基于BERT修剪的问答模型（Pruning a BERT-based Question Answering Model）

【论文推荐】基于BERT修剪的问答模型（Pruning a BERT-based Question Answering Model）

专知会员服务

30+阅读 · 2019年11月22日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

热门VIP内容

开通专知VIP会员享更多权益服务

探秘Palantir：驱动美情报的科技巨头

《美国海军军事海运司令部 2026年手册》

算法战加速推进：五角大楼项目、供应商生态体系与军事创新的战略重塑

《从技术突破到战场应用：发挥原型开发效能的最佳实践》报告

相关资讯

3倍加速CPU上的BERT模型部署

3倍加速CPU上的BERT模型部署

ApacheMXNet

11+阅读 · 2020年7月13日

8篇论文梳理BERT相关模型进展与反思 | MSRA出品

8篇论文梳理BERT相关模型进展与反思 | MSRA出品

量子位

11+阅读 · 2019年9月15日

【GitHub】BERT模型从训练到部署全流程

【GitHub】BERT模型从训练到部署全流程

专知

34+阅读 · 2019年6月28日

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

专知

20+阅读 · 2019年6月27日

深入理解BERT Transformer ，不仅仅是注意力机制

深入理解BERT Transformer ，不仅仅是注意力机制

大数据文摘

22+阅读 · 2019年3月19日

使用 Bert 预训练模型文本分类（内附源码）

使用 Bert 预训练模型文本分类（内附源码）

数据库开发

102+阅读 · 2019年3月12日

Perseus-BERT——业内性能极致优化的BERT训练方案

Perseus-BERT——业内性能极致优化的BERT训练方案

云栖社区

15+阅读 · 2019年2月20日

AI赋能法律 | NLP最强之谷歌BERT模型在智能司法领域的实践浅谈

AI赋能法律 | NLP最强之谷歌BERT模型在智能司法领域的实践浅谈

AINLP

24+阅读 · 2018年11月30日

最强NLP模型BERT喜迎PyTorch版！谷歌官方推荐，也会支持中文

最强NLP模型BERT喜迎PyTorch版！谷歌官方推荐，也会支持中文

量子位

13+阅读 · 2018年11月7日

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

AINLP

12+阅读 · 2018年11月1日

相关论文

Model Medicine: A Clinical Framework for Understanding, Diagnosing, and Treating AI Models

Arxiv

0+阅读 · 3月17日

TriTopic: Tri-Modal Graph-Based Topic Modeling with Iterative Refinement and Archetypes

Arxiv

0+阅读 · 2月22日

Agent Skill Framework: Perspectives on the Potential of Small Language Models in Industrial Environments

Arxiv

0+阅读 · 2月20日

Mining Type Constructs Using Patterns in AI-Generated Code

Arxiv

0+阅读 · 2月20日

Agent Skill Framework: Perspectives on the Potential of Small Language Models in Industrial Environments

Arxiv

0+阅读 · 2月18日

Developing AI Agents with Simulated Data: Why, what, and how?

Arxiv

0+阅读 · 2月17日

AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises

Arxiv

2+阅读 · 2月16日

Impacts of Generative AI on Agile Teams' Productivity: A Multi-Case Longitudinal Study

Arxiv

0+阅读 · 2月14日

Differentiable Modal Logic for Multi-Agent Diagnosis, Orchestration and Communication

Arxiv

0+阅读 · 2月12日

Collaborating with AI Agents: Field Experiments on Teamwork, Productivity, and Performance

Arxiv

0+阅读 · 2月5日

相关基金

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于多种网络模型的舆论领袖识别及其传播影响力仿真研究

国家自然科学基金

1+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向构建过程的范畴学习模型及其适应性机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

模仿型新产品开发过程及对新产品绩效的影响机制：中、美、印的跨国研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于构件的可信软件构造及其行为动态可信测评

国家自然科学基金

1+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员