Using intelligent systems to perceive psychological and social behaviors, that is, the underlying affective, cognitive, and pathological states that are manifested through observable behaviors and social interactions, remains a challenge due to their complex, multifaceted, and personalized nature. Existing work tackling these dimensions through specialized datasets and single-task systems often miss opportunities for scalability, cross-task transfer, and broader generalization. To address this gap, we curate Human Behavior Atlas, a unified benchmark of diverse behavioral tasks designed to support the development of foundation models for understanding psychological and social behaviors. Human Behavior Atlas comprises over 100,000 samples spanning text, audio, and visual modalities, covering tasks on affective states, cognitive states, pathologies, and social processes. Our unification efforts can reduce redundancy and cost, enable training to scale efficiently across tasks, and enhance generalization of behavioral features across domains. On Human Behavior Atlas, we train three models: Omnisapiens-7B SFT, Omnisapiens-7B BAM, and Omnisapiens-7B RL. We show that training on Human Behavior Atlas enables models to consistently outperform existing multimodal LLMs across diverse behavioral tasks. Pretraining on Human Behavior Atlas also improves transfer to novel behavioral datasets; with the targeted use of behavioral descriptors yielding meaningful performance gains. The benchmark, models, and codes can be found at: https://github.com/MIT-MI/human_behavior_atlas.


翻译:利用智能系统感知心理与社会行为——即通过可观察行为与社会互动所表现出的潜在情感、认知及病理状态——因其复杂、多面且个性化的本质而仍具挑战性。现有研究通过专用数据集与单任务系统处理这些维度时,往往错失了可扩展性、跨任务迁移及更广泛泛化的机遇。为填补这一空白,我们构建了人类行为图谱——一个统一的行为任务基准,旨在支持理解心理与社会行为的基础模型开发。人类行为图谱包含超过10万个涵盖文本、音频与视觉模态的样本,覆盖情感状态、认知状态、病理特征及社会过程等任务。我们的统一化工作能够减少冗余与成本,实现跨任务的高效规模化训练,并增强行为特征在跨领域中的泛化能力。基于人类行为图谱,我们训练了三个模型:Omnisapiens-7B SFT、Omnisapiens-7B BAM 与 Omnisapiens-7B RL。实验表明,在人类行为图谱上的训练能使模型在多样化行为任务中持续超越现有多模态大语言模型。基于人类行为图谱的预训练还提升了对新行为数据集的迁移能力;通过针对性使用行为描述符可产生显著性能提升。基准数据、模型及代码可通过以下链接获取:https://github.com/MIT-MI/human_behavior_atlas。

0
下载
关闭预览

相关内容

社交知识图谱研究综述
专知会员服务
97+阅读 · 2023年2月25日
「可解释知识图谱推理」最新方法综述
专知会员服务
89+阅读 · 2022年12月17日
多模态数据的行为识别综述
专知会员服务
88+阅读 · 2022年11月30日
专知会员服务
48+阅读 · 2020年12月8日
中科大-人工智能方向专业课程2020《脑与认知科学导论》
基于人体骨架的行为识别【附PPT与视频资料】
人工智能前沿讲习班
31+阅读 · 2019年1月15日
人脸识别最全知识图谱—清华大学出品
人工智能学家
10+阅读 · 2018年10月28日
【团队新作】连续情感识别,精准捕捉你的小情绪!
中国科学院自动化研究所
16+阅读 · 2018年4月17日
干货|基于双流递归神经网络的人体骨架行为识别!
全球人工智能
13+阅读 · 2017年12月15日
报名 | 让机器读懂你的意图——人体姿态估计入门
人工智能头条
10+阅读 · 2017年9月19日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员