VASTU: Value-Aligned Social Toolkit for Online Content Curation - 专知论文

会员服务 ·

0

社交 · 工具 · 系统 · 对齐 · 在线 ·

VASTU: Value-Aligned Social Toolkit for Online Content Curation

翻译：VASTU：面向在线内容策展的价值对齐社交工具包

Agam Goyal,Xianyang Zhan,Charlotte Lambert,Koustuv Saha,Eshwar Chandrasekharan

from arxiv, Preprint: 15 pages, 4 figures, 6 tables

Detecting what content communities value is a foundational challenge for social computing systems -- from feed curation and content ranking to moderation tools and personalized recommendation systems. Yet existing approaches remain fragmented across methodological paradigms, and it remains unclear which methods best capture community-specific notions of value. We introduce VASTU (Value-Aligned Social Toolkit for Online Content Curation), a benchmark and evaluation framework for systematically comparing approaches to detecting community-valued content. VASTU includes a dataset of 75,000 comments from 15 diverse Reddit communities, annotated with community approval labels and rich linguistic features. Using VASTU, we evaluate feature-based models, transformers, prompted and fine-tuned language models under global versus community-specific training regimes. We find that community-specific models consistently outperform global approaches, with fine-tuned transformers achieving the strongest performance (0.72 AUROC). Notably, fine-tuned SLMs (0.65 AUROC) substantially outperform prompted LLMs (0.60 AUROC) despite being 100 times smaller. Counterintuitively, chain-of-thought prompting provides no benefit, and reasoning models perform the worst (0.53 AUROC), suggesting this task requires learning community norms rather than test-time reasoning. By releasing VASTU, we provide a standardized benchmark to advance research on value-aligned sociotechnical systems.

翻译：检测社区所重视的内容是社交计算系统面临的基础性挑战——从信息流策展、内容排序到审核工具和个性化推荐系统皆然。然而，现有方法仍分散在不同的方法论范式中，且尚不清楚何种方法最能捕捉社区特定的价值观念。本文介绍VASTU（面向在线内容策展的价值对齐社交工具包），这是一个用于系统比较社区价值内容检测方法的基准测试与评估框架。VASTU包含一个来自15个多样化Reddit社区的75,000条评论数据集，标注有社区认可标签及丰富的语言特征。利用VASTU，我们评估了基于特征的模型、Transformer模型、提示调优与微调的语言模型在全局训练与社区特定训练模式下的表现。研究发现，社区特定模型始终优于全局方法，其中微调的Transformer模型取得了最佳性能（0.72 AUROC）。值得注意的是，微调的小型语言模型（0.65 AUROC）显著优于提示调优的大型语言模型（0.60 AUROC），尽管其规模小100倍。与直觉相反，思维链提示未带来任何收益，而推理模型表现最差（0.53 AUROC），这表明该任务需要学习社区规范而非测试时推理。通过发布VASTU，我们为推进价值对齐社会技术系统的研究提供了标准化基准。

0

相关内容

WWW’24 工业 Track：协同增强的新交互产品中的用户生命价值预估

WWW’24 工业 Track：协同增强的新交互产品中的用户生命价值预估

专知会员服务

10+阅读 · 2024年6月2日

ChatGPT引领AIGC新浪潮！暨南大学等最新《人工智能生成内容AIGC》全面综述，详述AIGC的3个前沿功能和6个高级特征

ChatGPT引领AIGC新浪潮！暨南大学等最新《人工智能生成内容AIGC》全面综述，详述AIGC的3个前沿功能和6个高级特征

专知会员服务

139+阅读 · 2023年4月18日

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

专知会员服务

40+阅读 · 2020年12月11日

【论文推荐】 GIANT: Scalable Creation of a Web-scale Ontology，基于web本体的可扩展创建

【论文推荐】 GIANT: Scalable Creation of a Web-scale Ontology，基于web本体的可扩展创建

专知会员服务

21+阅读 · 2020年4月5日

【NeurlPS2019论文强烈推荐】vGraph:联合社区检测和节点表示学习的生成模型，vGraph: A Generative Model for Joint Community Detection and Node Representational Learning

【NeurlPS2019论文强烈推荐】vGraph:联合社区检测和节点表示学习的生成模型，vGraph: A Generative Model for Joint Community Detection and Node Representational Learning

专知会员服务

30+阅读 · 2019年12月17日

腾讯信息流内容理解技术实践，A User-Centered Concept Mining System for Query and Document Understanding at Tencent

腾讯信息流内容理解技术实践，A User-Centered Concept Mining System for Query and Document Understanding at Tencent

专知会员服务

41+阅读 · 2019年12月15日

【KDD2019|讲座推荐】社会用户兴趣挖掘：方法与应用：Social User Interest Mining: Methods and Applications

【KDD2019|讲座推荐】社会用户兴趣挖掘：方法与应用：Social User Interest Mining: Methods and Applications

专知会员服务

41+阅读 · 2019年12月11日

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

专知会员服务

57+阅读 · 2019年11月20日

社交网络上议题社群的公共焦虑研究，中国人民大学新闻学院塔娜讲师，第八届全国社会媒体处理大会SMP2019

社交网络上议题社群的公共焦虑研究，中国人民大学新闻学院塔娜讲师，第八届全国社会媒体处理大会SMP2019

专知会员服务

15+阅读 · 2019年10月23日

面向社会媒体的多模态情感分析与表达，搜狗AI交互技术中心高级总监陈伟，第八届全国社会媒体处理大会SMP2019

面向社会媒体的多模态情感分析与表达，搜狗AI交互技术中心高级总监陈伟，第八届全国社会媒体处理大会SMP2019

专知会员服务

51+阅读 · 2019年10月22日

图机器学习经典算法 louvain 完全解读

图机器学习经典算法 louvain 完全解读

图与推荐

11+阅读 · 2020年8月10日

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

AI前线

15+阅读 · 2019年9月22日

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

哈工大SCIR

12+阅读 · 2019年8月16日

视频内容理解在Hulu的应用与实践

视频内容理解在Hulu的应用与实践

AI前线

12+阅读 · 2019年2月16日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

13+阅读 · 2018年8月15日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

【推荐系统】详解基于内容的推荐算法

【推荐系统】详解基于内容的推荐算法

产业智能官

23+阅读 · 2018年1月11日

基于图片内容的深度学习图片检索（一）

基于图片内容的深度学习图片检索（一）

七月在线实验室

20+阅读 · 2017年10月1日

视觉里程计：起源、优势、对比、应用

视觉里程计：起源、优势、对比、应用

计算机视觉life

18+阅读 · 2017年7月17日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于客户价值理论的社交媒体营销：提升品牌价值与客户关系产出

国家自然科学基金

0+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

内容中心移动社交网络高效安全匿名通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会网络的大型在线社区中虚拟商品购买行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

微信技术使用与策略匹配对企业价值创造的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

在线社会网络中信息级联效应及社会影响力优化策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

大规模在线社会网络社区发现及隐私保护研究

国家自然科学基金

1+阅读 · 2014年12月31日

IntRec: Intent-based Retrieval with Contrastive Refinement

Arxiv

0+阅读 · 2月19日

Leveraging Content Producer Networks and User Perception to Detect Online Discursive Communities

Arxiv

0+阅读 · 2月13日

Bonsai: Intentional and Personalized Social Media Feeds

Arxiv

0+阅读 · 2月7日

VAO: Validation-Aligned Optimization for Cross-Task Generative Auto-Bidding

Arxiv

0+阅读 · 2月5日

VALUEFLOW: Toward Pluralistic and Steerable Value-based Alignment in Large Language Models

Arxiv

0+阅读 · 2月3日

PersonaAct: Simulating Short-Video Users with Personalized Agents for Counterfactual Filter Bubble Auditing

Arxiv

0+阅读 · 1月30日

PULSE: Socially-Aware User Representation Modeling Toward Parameter-Efficient Graph Collaborative Filtering

Arxiv

0+阅读 · 1月28日

FedGraph-VASP: Privacy-Preserving Federated Graph Learning with Post-Quantum Security for Cross-Institutional Anti-Money Laundering

Arxiv

0+阅读 · 1月25日

PrivTune: Efficient and Privacy-Preserving Fine-Tuning of Large Language Models via Device-Cloud Collaboration

Arxiv

0+阅读 · 1月21日

PULSE: Socially-Aware User Representation Modeling Toward Parameter-Efficient Graph Collaborative Filtering

Arxiv

0+阅读 · 1月21日

VIP会员

文章信息

相关主题

最新内容

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

3+阅读 · 今天8:04

《异构人类团队的协作决策过程混合建模研究》

《异构人类团队的协作决策过程混合建模研究》

专知会员服务

4+阅读 · 今天7:59

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

专知会员服务

4+阅读 · 今天7:56

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

专知会员服务

4+阅读 · 今天7:50

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

4+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

5+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

13+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

7+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

7+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

5+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

11+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

7+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

10+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

9+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

12+阅读 · 7月26日

相关VIP内容

WWW’24 工业 Track：协同增强的新交互产品中的用户生命价值预估

WWW’24 工业 Track：协同增强的新交互产品中的用户生命价值预估

专知会员服务

10+阅读 · 2024年6月2日

ChatGPT引领AIGC新浪潮！暨南大学等最新《人工智能生成内容AIGC》全面综述，详述AIGC的3个前沿功能和6个高级特征

ChatGPT引领AIGC新浪潮！暨南大学等最新《人工智能生成内容AIGC》全面综述，详述AIGC的3个前沿功能和6个高级特征

专知会员服务

139+阅读 · 2023年4月18日

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

专知会员服务

40+阅读 · 2020年12月11日

【论文推荐】 GIANT: Scalable Creation of a Web-scale Ontology，基于web本体的可扩展创建

【论文推荐】 GIANT: Scalable Creation of a Web-scale Ontology，基于web本体的可扩展创建

专知会员服务

21+阅读 · 2020年4月5日

【NeurlPS2019论文强烈推荐】vGraph:联合社区检测和节点表示学习的生成模型，vGraph: A Generative Model for Joint Community Detection and Node Representational Learning

【NeurlPS2019论文强烈推荐】vGraph:联合社区检测和节点表示学习的生成模型，vGraph: A Generative Model for Joint Community Detection and Node Representational Learning

专知会员服务

30+阅读 · 2019年12月17日

腾讯信息流内容理解技术实践，A User-Centered Concept Mining System for Query and Document Understanding at Tencent

腾讯信息流内容理解技术实践，A User-Centered Concept Mining System for Query and Document Understanding at Tencent

专知会员服务

41+阅读 · 2019年12月15日

【KDD2019|讲座推荐】社会用户兴趣挖掘：方法与应用：Social User Interest Mining: Methods and Applications

【KDD2019|讲座推荐】社会用户兴趣挖掘：方法与应用：Social User Interest Mining: Methods and Applications

专知会员服务

41+阅读 · 2019年12月11日

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

专知会员服务

57+阅读 · 2019年11月20日

社交网络上议题社群的公共焦虑研究，中国人民大学新闻学院塔娜讲师，第八届全国社会媒体处理大会SMP2019

社交网络上议题社群的公共焦虑研究，中国人民大学新闻学院塔娜讲师，第八届全国社会媒体处理大会SMP2019

专知会员服务

15+阅读 · 2019年10月23日

面向社会媒体的多模态情感分析与表达，搜狗AI交互技术中心高级总监陈伟，第八届全国社会媒体处理大会SMP2019

面向社会媒体的多模态情感分析与表达，搜狗AI交互技术中心高级总监陈伟，第八届全国社会媒体处理大会SMP2019

专知会员服务

51+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

《异构人类团队的协作决策过程混合建模研究》

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

面向国防作战的最佳自主与蜂群无人机技术

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

相关资讯

图机器学习经典算法 louvain 完全解读

图机器学习经典算法 louvain 完全解读

图与推荐

11+阅读 · 2020年8月10日

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

AI前线

15+阅读 · 2019年9月22日

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

哈工大SCIR

12+阅读 · 2019年8月16日

视频内容理解在Hulu的应用与实践

视频内容理解在Hulu的应用与实践

AI前线

12+阅读 · 2019年2月16日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

13+阅读 · 2018年8月15日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

【推荐系统】详解基于内容的推荐算法

【推荐系统】详解基于内容的推荐算法

产业智能官

23+阅读 · 2018年1月11日

基于图片内容的深度学习图片检索（一）

基于图片内容的深度学习图片检索（一）

七月在线实验室

20+阅读 · 2017年10月1日

视觉里程计：起源、优势、对比、应用

视觉里程计：起源、优势、对比、应用

计算机视觉life

18+阅读 · 2017年7月17日

相关论文

IntRec: Intent-based Retrieval with Contrastive Refinement

Arxiv

0+阅读 · 2月19日

Leveraging Content Producer Networks and User Perception to Detect Online Discursive Communities

Arxiv

0+阅读 · 2月13日

Bonsai: Intentional and Personalized Social Media Feeds

Arxiv

0+阅读 · 2月7日

VAO: Validation-Aligned Optimization for Cross-Task Generative Auto-Bidding

Arxiv

0+阅读 · 2月5日

VALUEFLOW: Toward Pluralistic and Steerable Value-based Alignment in Large Language Models

Arxiv

0+阅读 · 2月3日

PersonaAct: Simulating Short-Video Users with Personalized Agents for Counterfactual Filter Bubble Auditing

Arxiv

0+阅读 · 1月30日

PULSE: Socially-Aware User Representation Modeling Toward Parameter-Efficient Graph Collaborative Filtering

Arxiv

0+阅读 · 1月28日

FedGraph-VASP: Privacy-Preserving Federated Graph Learning with Post-Quantum Security for Cross-Institutional Anti-Money Laundering

Arxiv

0+阅读 · 1月25日

PrivTune: Efficient and Privacy-Preserving Fine-Tuning of Large Language Models via Device-Cloud Collaboration

Arxiv

0+阅读 · 1月21日

PULSE: Socially-Aware User Representation Modeling Toward Parameter-Efficient Graph Collaborative Filtering

Arxiv

0+阅读 · 1月21日

相关基金

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于客户价值理论的社交媒体营销：提升品牌价值与客户关系产出

国家自然科学基金

0+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

内容中心移动社交网络高效安全匿名通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会网络的大型在线社区中虚拟商品购买行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

微信技术使用与策略匹配对企业价值创造的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

在线社会网络中信息级联效应及社会影响力优化策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

大规模在线社会网络社区发现及隐私保护研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员