Traditional approaches to semantic polarity in computational linguistics treat sentiment as a unidimensional scale, overlooking the multidimensional structure of language. This work introduces TOPol (Topic-Orientation POLarity), a semi-unsupervised framework for reconstructing and interpreting multidimensional narrative polarity fields under human-on-the-loop (HoTL) defined contextual boundaries (CBs). The framework embeds documents using a transformer-based large language model (tLLM), applies neighbor-tuned UMAP projection, and segments topics via Leiden partitioning. Given a CB between discourse regimes A and B, TOPol computes directional vectors between corresponding topic-boundary centroids, yielding a polarity field that quantifies fine-grained semantic displacement during regime shifts. This vectorial representation enables assessing CB quality and detecting polarity changes, guiding HoTL CB refinement. To interpret identified polarity vectors, the tLLM compares their extreme points and produces contrastive labels with estimated coverage. Robustness analyses show that only CB definitions (the main HoTL-tunable parameter) significantly affect results, confirming methodological stability. We evaluate TOPol on two corpora: (i) U.S. Central Bank speeches around a macroeconomic breakpoint, capturing non-affective semantic shifts, and (ii) Amazon product reviews across rating strata, where affective polarity aligns with NRC valence. Results demonstrate that TOPol consistently captures both affective and non-affective polarity transitions, providing a scalable, generalizable, and interpretable framework for context-sensitive multidimensional discourse analysis.


翻译:计算语言学中传统的语义极性方法将情感视为单维标度,忽视了语言的多维结构。本文提出TOPol(主题导向极性)——一种半无监督框架,用于在人在回路(HoTL)定义的语境边界(CBs)下重建并解释多维叙事极性场。该框架使用基于Transformer的大语言模型(tLLM)嵌入文档,应用邻域调优的UMAP投影,并通过Leiden分割算法划分主题。给定话语体系A与B之间的CB,TOPol计算对应主题边界质心间的方向向量,生成量化体系转换过程中细粒度语义位移的极性场。这种向量表征能够评估CB质量并检测极性变化,从而指导HoTL的CB优化。为解释识别出的极性向量,tLLM比较其端点并生成带有估计覆盖度的对比标签。鲁棒性分析表明,仅CB定义(主要的HoTL可调参数)对结果有显著影响,证实了方法的稳定性。我们在两个语料库上评估TOPol:(i)宏观经济断点前后的美国央行演讲(捕捉非情感性语义转移),以及(ii)跨评分层级的亚马逊产品评论(其情感极性与NRC效价一致)。结果表明,TOPol能稳定捕捉情感与非情感极性转换,为语境敏感的多维话语分析提供了一个可扩展、可泛化且可解释的框架。

0
下载
关闭预览

相关内容

国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Geometric modelling of spatial extremes
Arxiv
0+阅读 · 2月19日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员