Narratives about economic events and policies are widely recognised as influential drivers of economic and business behaviour. Yet the statistical identification of narrative emergence remains underdeveloped. Narratives evolve gradually, exhibit subtle shifts in content, and may exert influence disproportionate to their observable frequency, making it difficult to determine when observed changes reflect genuine structural shifts rather than routine variation in language use. We propose a statistical framework for detecting narrative emergence in longitudinal text corpora using Latent Dirichlet Allocation (LDA). We define emergence as a sustained increase in a topic's relative prominence over time and articulate a statistical framework for interpreting such trajectories, recognising that topic proportions are latent, model-estimated quantities. We illustrate the approach using a corpus of academic publications in economics spanning 1970-2018, where Nobel Prize-recognised contributions serve as externally observable signals of influential narratives. Topics associated with these contributions display sustained increases in estimated prevalence that coincide with periods of heightened citation activity and broader disciplinary recognition. These findings indicate that model-based topic trajectories can reflect identifiable shifts in economic discourse and provide a statistically grounded basis for analysing thematic change in longitudinal textual data.


翻译:关于经济事件与政策的叙事被广泛认为是影响经济与商业行为的重要驱动因素。然而,叙事涌现的统计识别方法仍不完善。叙事逐渐演化,内容呈现细微变化,且其影响力可能与其可观测频率不成比例,这使得难以判断观察到的变化何时反映了真实的结构性转变,而非语言使用的常规波动。我们提出了一种基于潜在狄利克雷分配(LDA)的统计框架,用于检测纵向文本语料库中的叙事涌现。我们将涌现定义为一个主题相对重要性随时间持续增长的过程,并构建了一个统计框架来解释此类轨迹,同时认识到主题比例是潜在的、由模型估计的量。我们使用1970年至2018年间经济学学术出版物语料库对该方法进行了说明,其中诺贝尔奖认可的贡献作为有影响力的叙事的外部可观测信号。与这些贡献相关的主题在估计流行度上显示出持续增长,这种增长与引用活动加剧及更广泛的学科认可时期相吻合。这些发现表明,基于模型的主题轨迹能够反映经济话语中可识别的转变,并为分析纵向文本数据中的主题变化提供了统计学基础。

0
下载
关闭预览

相关内容

【干货书】大规模文本数据的结构化知识挖掘,200页pdf
专知会员服务
70+阅读 · 2022年8月20日
【KDD2022】海量文本语料库中的无监督关键事件检测
专知会员服务
33+阅读 · 2022年6月13日
专知会员服务
129+阅读 · 2021年6月12日
专知会员服务
38+阅读 · 2021年5月29日
斯坦福《序列处理的深度学习架构》概述,31页pdf
专知会员服务
56+阅读 · 2021年1月3日
事件知识图谱构建技术与应用综述
专知
25+阅读 · 2020年8月6日
【SCIR笔记】文档级事件抽取简述
深度学习自然语言处理
17+阅读 · 2020年7月30日
事件知识图谱构建研究进展与趋势
THU数据派
99+阅读 · 2019年12月11日
论文浅尝 | 采用多层注意力机制的事件检测
开放知识图谱
24+阅读 · 2019年8月24日
干货|当深度学习遇见自动文本摘要,seq2seq+attention
机器学习算法与Python学习
10+阅读 · 2018年5月28日
语料库构建——自然语言理解的基础
计算机研究与发展
11+阅读 · 2017年8月21日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
0+阅读 · 14分钟前
综述 | 世界动作模型:少做梦,多行动
专知会员服务
0+阅读 · 16分钟前
美以伊冲突:无人机与人工智能的运用
专知会员服务
1+阅读 · 28分钟前
《特种部队在透明战场中的生存力》最新报告
专知会员服务
1+阅读 · 48分钟前
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关资讯
事件知识图谱构建技术与应用综述
专知
25+阅读 · 2020年8月6日
【SCIR笔记】文档级事件抽取简述
深度学习自然语言处理
17+阅读 · 2020年7月30日
事件知识图谱构建研究进展与趋势
THU数据派
99+阅读 · 2019年12月11日
论文浅尝 | 采用多层注意力机制的事件检测
开放知识图谱
24+阅读 · 2019年8月24日
干货|当深度学习遇见自动文本摘要,seq2seq+attention
机器学习算法与Python学习
10+阅读 · 2018年5月28日
语料库构建——自然语言理解的基础
计算机研究与发展
11+阅读 · 2017年8月21日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员