Personality recognition from text is typically cast as hard-label classification, which obscures the graded, prototype-like nature of human personality judgments. We present ProtoMBTI, a cognitively aligned framework for MBTI inference that operationalizes prototype theory within an LLM-based pipeline. First, we construct a balanced, quality-controlled corpus via LLM-guided multi-dimensional augmentation (semantic, linguistic, sentiment). Next, we LoRA-fine-tune a lightweight (<=2B) encoder to learn discriminative embeddings and to standardize a bank of personality prototypes. At inference, we retrieve top-k prototypes for a query post and perform a retrieve--reuse--revise--retain cycle: the model aggregates prototype evidence via prompt-based voting, revises when inconsistencies arise, and, upon correct prediction, retains the sample to continually enrich the prototype library. Across Kaggle and Pandora benchmarks, ProtoMBTI improves over baselines on both the four MBTI dichotomies and the full 16-type task, and exhibits robust cross-dataset generalization. Our results indicate that aligning the inference process with psychological prototype reasoning yields gains in accuracy, interpretability, and transfer for text-based personality modeling.


翻译:基于文本的人格识别通常被视作硬标签分类问题,这掩盖了人类人格判断所具有的渐变性及类原型的本质。本文提出ProtoMBTI——一个认知对齐的MBTI推断框架,该框架将原型理论操作化于基于大语言模型(LLM)的流程中。首先,我们通过LLM引导的多维度增强(语义、语言、情感)构建了一个平衡且质量可控的语料库。接着,我们使用LoRA对轻量级(≤2B)编码器进行微调,以学习判别性嵌入并标准化人格原型库。在推断阶段,我们为查询帖子检索top-k原型,并执行检索-复用-修正-保留循环:模型通过基于提示的投票聚合原型证据,在出现不一致时进行修正,并在预测正确时保留样本以持续丰富原型库。在Kaggle和Pandora基准测试中,ProtoMBTI在四项MBTI二分维度及完整的16型人格任务上均优于基线模型,并展现出强大的跨数据集泛化能力。我们的结果表明,将推断过程与心理原型推理相对齐,能够提升基于文本的人格建模在准确性、可解释性及迁移性方面的表现。

0
下载
关闭预览

相关内容

【博士论文】《自然语言处理中的因果推理》
专知会员服务
22+阅读 · 2025年4月25日
大型语言模型中的人格综述
专知会员服务
42+阅读 · 2024年6月30日
大型语言模型在表格推理中的应用综述
专知会员服务
47+阅读 · 2024年2月14日
大模型道德价值观对齐问题剖析
专知会员服务
79+阅读 · 2023年10月3日
【大模型对齐】利用对齐使大型语言模型更好地推理
专知会员服务
48+阅读 · 2023年9月8日
「因果推理」概述论文,13页pdf
专知
16+阅读 · 2021年3月20日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
【清华大学】元知识图谱推理
专知
129+阅读 · 2019年9月2日
基于人体骨架的行为识别【附PPT与视频资料】
人工智能前沿讲习班
31+阅读 · 2019年1月15日
关系推理:基于表示学习和语义要素
计算机研究与发展
19+阅读 · 2017年8月22日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员