The launch of Grokipedia, an AI-generated encyclopedia developed by Elon Musk's xAI, was presented as a response to perceived ideological and structural biases in Wikipedia, aiming to produce "truthful" entries using the Grok large language model. Yet whether an AI-driven alternative can escape the biases and limitations of human-edited platforms remains unclear. This study conducts a large-scale computational comparison of 17,790 matched article pairs from the 20,000 most-edited English Wikipedia pages. Using metrics spanning lexical richness, readability, reference density, structural features, and semantic similarity, we assess how closely the two platforms align in form and substance. We find that Grokipedia articles are substantially longer and contain significantly fewer references per word. Moreover, Grokipedia's content divides into two distinct groups: one that remains semantically and stylistically aligned with Wikipedia, and another that diverges sharply. Among the dissimilar articles, we observe a systematic rightward shift in the political bias of cited sources, concentrated primarily in entries related to politics, history, and religion. More broadly, the findings indicate that AI-generated encyclopedic content departs from established editorial norms, favoring narrative expansion over citation-based verification, raising questions about transparency, provenance, and the governance of knowledge in automated information systems.


翻译:Grokipedia是由埃隆·马斯克旗下xAI公司开发的AI生成百科全书,其推出被表述为对维基百科中感知到的意识形态与结构偏见的回应,旨在通过Grok大语言模型生成"真实"条目。然而,AI驱动的替代平台能否摆脱人工编辑平台的偏见与局限仍不明确。本研究对来自英文维基百科编辑量最高的20,000个页面中的17,790组匹配文章对进行了大规模计算比较。通过涵盖词汇丰富度、可读性、引用密度、结构特征及语义相似度的度量指标,我们评估了两个平台在形式与实质内容上的接近程度。研究发现,Grokipedia文章篇幅显著更长,且每单词对应的引用数量明显更少。此外,Grokipedia内容可划分为两个明显不同的群体:一类在语义和风格上与维基百科保持对齐,另一类则存在显著差异。在相异性较高的文章中,我们观察到被引来源存在系统性右倾的政治偏见,主要集中在政治、历史和宗教相关条目中。更广泛而言,研究结果表明AI生成的百科内容偏离了既定的编辑规范,倾向于叙事扩展而非基于引证的验证,这引发了关于自动化信息系统中透明度、来源追溯及知识治理的若干问题。

0
下载
关闭预览

相关内容

维基百科( Wikipedia.org)是一个基于 Wiki 技术的全球性多语言百科全书协作项目,同时也是一部在网际网络上呈现的网络百科全书网站,其目标及宗旨是为全人类提供自由的百科全书。目前 Alexa 全球网站排名第六。
【新书】Essential GraphRAG: 知识图谱增强的RAG
专知会员服务
32+阅读 · 2025年7月17日
百度基于异构互联知识图谱的多模内容创作技术
专知会员服务
52+阅读 · 2022年6月7日
Github项目推荐 | PyTorch 中文手册 (pytorch handbook)
技术动态 | TechKG:一个面向中文学术领域的大型知识图谱
开放知识图谱
25+阅读 · 2018年12月20日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
【新书】Essential GraphRAG: 知识图谱增强的RAG
专知会员服务
32+阅读 · 2025年7月17日
百度基于异构互联知识图谱的多模内容创作技术
专知会员服务
52+阅读 · 2022年6月7日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员