URLs serve as bridges between social media platforms and the broader web, linking user-generated content to external information resources. On Twitter (X), approximately one in five tweets contains at least one URL, underscoring their central role in information dissemination. While prior studies have examined the motivations of authors who share URLs, such author-centered intentions are difficult to observe in practice. To enable broader downstream use, this work investigates reader-centered interpretations, i.e., how users perceive the intentions behind hyperlinks included in posts. We develop an intent taxonomy for including hyperlinks in social posts through a hybrid approach that begins with a bottom-up, data-driven process using large-scale crowdsourced annotations, and is then refined using large language model assistance to generate descriptive category names and precise definitions. The final taxonomy comprises 6 top-level categories and 26 fine-grained intention classes, capturing diverse communicative purposes. Applying this taxonomy, we annotate and analyze 1000 user posts, revealing that advertising, arguing, and sharing are the most prevalent intentions. This resulting taxonomy provides a foundation for intent-aware information retrieval and NLP applications, enabling more accurate retrieval, recommendation, and understanding of social media content.


翻译:URL作为社交媒体平台与更广泛网络之间的桥梁,将用户生成内容与外部信息资源相连接。在Twitter(X)平台上,约五分之一的推文包含至少一个URL,凸显了其在信息传播中的核心作用。虽然先前研究已探讨过URL分享者的动机,但此类以作者为中心的意图在实践中难以观测。为支持更广泛的下游应用,本研究从读者中心视角出发,探究用户如何理解帖子中所含超链接的嵌入意图。通过混合研究方法,我们构建了社交媒体帖子中嵌入超链接的意图分类体系:首先采用自底向上的数据驱动流程进行大规模众包标注,继而借助大语言模型辅助生成描述性类别名称与精确定义。最终形成的分类体系包含6个顶层类别和26个细粒度意图类别,涵盖了多样化的传播目的。应用该分类体系对1000条用户帖子进行标注分析后发现,广告宣传、观点论证和信息共享是最普遍的意图类型。该分类体系为意图感知的信息检索与自然语言处理应用奠定了基础,有助于实现更精准的社交媒体内容检索、推荐与理解。

0
下载
关闭预览

相关内容

智能体网络:用AI智能体编织下一代网络
专知会员服务
30+阅读 · 2025年8月5日
基于深度神经网络的实体链接研究综述
专知会员服务
15+阅读 · 2024年9月8日
《在线影响力行动的社交网络策略分析》203页
专知会员服务
26+阅读 · 2024年7月1日
 【中科院信工所】社交媒体情感分析,40页ppt
专知会员服务
104+阅读 · 2019年12月13日
搜索query意图识别的演进
DataFunTalk
13+阅读 · 2020年11月15日
网络表示学习概述
机器学习与推荐算法
19+阅读 · 2020年3月27日
技术动态 | 知识图谱上的实体链接
开放知识图谱
69+阅读 · 2019年9月8日
图神经网络最近这么火,不妨看看我们精选的这七篇
人工智能前沿讲习班
37+阅读 · 2018年12月10日
推荐系统概述
Linux爱好者
20+阅读 · 2018年9月6日
【社交网络】一文读懂社交网络分析
产业智能官
15+阅读 · 2017年10月14日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
27+阅读 · 2014年12月31日
VIP会员
相关资讯
搜索query意图识别的演进
DataFunTalk
13+阅读 · 2020年11月15日
网络表示学习概述
机器学习与推荐算法
19+阅读 · 2020年3月27日
技术动态 | 知识图谱上的实体链接
开放知识图谱
69+阅读 · 2019年9月8日
图神经网络最近这么火,不妨看看我们精选的这七篇
人工智能前沿讲习班
37+阅读 · 2018年12月10日
推荐系统概述
Linux爱好者
20+阅读 · 2018年9月6日
【社交网络】一文读懂社交网络分析
产业智能官
15+阅读 · 2017年10月14日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
27+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员