Building NLP systems for subjective tasks requires one to ensure their alignment to contrasting human values. We propose the MultiCalibrated Subjective Task Learner framework (MC-STL), which clusters annotations into identifiable human value clusters by three approaches (similarity of annotator rationales, expert-value taxonomies or rater's sociocultural descriptors) and calibrates predictions for each value cluster by learning cluster-specific embeddings. We demonstrate MC-STL on several subjective learning settings, including ordinal, binary, and preference learning predictions, and evaluate it on multiple datasets covering toxic chatbot conversations, offensive social media posts, and human preference alignment. The results show that MC-STL consistently outperforms the baselines that ignore the latent value structure of the annotations, delivering gains in discrimination, value-specific calibration, and disagreement-aware metrics.


翻译:构建面向主观任务的NLP系统需要确保其与多元人类价值观的对齐。我们提出多校准主观任务学习框架(MC-STL),该框架通过三种方法(标注者理由的相似性、专家价值观分类法或评分者社会文化描述符)将标注聚类为可识别的人类价值观簇,并通过学习簇特定嵌入对每个价值观簇的预测进行校准。我们在多种主观学习场景(包括序数、二元及偏好学习预测)中验证MC-STL框架,并在涵盖有毒聊天机器人对话、冒犯性社交媒体帖子及人类偏好对齐的多个数据集上进行评估。结果表明,MC-STL在区分度、价值观特定校准和分歧感知指标上持续优于忽略标注潜在价值结构的基线方法。

0
下载
关闭预览

相关内容

大语言模型价值观对齐研究与展望
专知会员服务
37+阅读 · 2024年3月19日
《深度学习多标签学习》最新综述
专知会员服务
47+阅读 · 2024年1月31日
哈工大秦兵教授 | 大语言模型之人类价值观对齐
专知会员服务
62+阅读 · 2023年8月4日
专知会员服务
15+阅读 · 2021年9月29日
注意力图神经网络的多标签文本分类
专知会员服务
112+阅读 · 2020年3月28日
标签间相关性在多标签分类问题中的应用
人工智能前沿讲习班
23+阅读 · 2019年6月5日
什么是语义角色标注?
人工智能头条
18+阅读 · 2019年4月28日
知识在检索式对话系统的应用
微信AI
32+阅读 · 2018年9月20日
【论文笔记】自注意力机制学习句子embedding
原创 | Attention Modeling for Targeted Sentiment
黑龙江大学自然语言处理实验室
25+阅读 · 2017年11月5日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
VIP会员
相关资讯
标签间相关性在多标签分类问题中的应用
人工智能前沿讲习班
23+阅读 · 2019年6月5日
什么是语义角色标注?
人工智能头条
18+阅读 · 2019年4月28日
知识在检索式对话系统的应用
微信AI
32+阅读 · 2018年9月20日
【论文笔记】自注意力机制学习句子embedding
原创 | Attention Modeling for Targeted Sentiment
黑龙江大学自然语言处理实验室
25+阅读 · 2017年11月5日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员