QP-OneModel: A Unified Generative LLM for Multi-Task Query Understanding in Xiaohongshu Search

Query Processing (QP) bridges user intent and content supply in large-scale Social Network Service (SNS) search engines. Traditional QP systems rely on pipelines of isolated discriminative models (e.g., BERT), suffering from limited semantic understanding and high maintenance overhead. While Large Language Models (LLMs) offer a potential solution, existing approaches often optimize sub-tasks in isolation, neglecting intrinsic semantic synergy and necessitating independent iterations. Moreover, standard generative methods often lack grounding in SNS scenarios, failing to bridge the gap between open-domain corpora and informal SNS linguistic patterns, while struggling to adhere to rigorous business definitions. We present QP-OneModel, a Unified Generative LLM for Multi-Task Query Understanding in the SNS domain. We reformulate heterogeneous sub-tasks into a unified sequence generation paradigm, adopting a progressive three-stage alignment strategy culminating in multi-reward Reinforcement Learning. Furthermore, QP-OneModel generates intent descriptions as a novel high-fidelity semantic signal, effectively augmenting downstream tasks such as query rewriting and ranking. Offline evaluations show QP-OneModel achieves a 7.35% overall gain over discriminative baselines, with significant F1 boosts in NER (+9.01%) and Term Weighting (+9.31%). It also exhibits superior generalization, surpassing a 32B model by 7.60% accuracy on unseen tasks. Fully deployed at Xiaohongshu, online A/B tests confirm its industrial value, optimizing retrieval relevance (DCG) by 0.21% and lifting user retention by 0.044%.

翻译：查询处理（QP）在大规模社交网络服务（SNS）搜索引擎中连接用户意图与内容供给。传统的QP系统依赖于由孤立判别模型（例如BERT）构成的流水线，存在语义理解有限和维护开销高的问题。虽然大语言模型（LLMs）提供了一种潜在的解决方案，但现有方法通常孤立地优化子任务，忽略了内在的语义协同效应，且需要进行独立的迭代更新。此外，标准的生成方法通常缺乏对SNS场景的针对性，未能弥合开放域语料库与非正式SNS语言模式之间的差距，同时也难以遵循严格的业务定义。我们提出了QP-OneModel，一个面向SNS领域多任务查询理解的统一生成式大语言模型。我们将异构的子任务重新表述为统一的序列生成范式，采用渐进式三阶段对齐策略，最终结合多奖励强化学习进行优化。此外，QP-OneModel生成意图描述作为一种新颖的高保真语义信号，有效增强了查询改写和排序等下游任务。离线评估表明，QP-OneModel相比判别式基线模型实现了7.35%的整体性能提升，在命名实体识别（NER，+9.01%）和词权重计算（Term Weighting，+9.31%）任务上的F1分数显著提高。该模型还展现出卓越的泛化能力，在未见任务上的准确率超越了320亿参数模型7.60%。QP-OneModel已在小红书全面部署，在线A/B测试证实了其工业价值，将检索相关性（DCG）优化了0.21%，并将用户留存率提升了0.044%。

相关内容

泛 SNS

关注 0

SNS，全称Social Networking Services，即社会性网络服务，专指旨在帮助人们建立社会性网络的互联网应用服务。也指社会现有已成熟普及的信息载体，如短信SMS服务。SNS的另一种常用解释：全称Social Network Site，即“社交网站”或“社交网”。社会性网络（Social Networking）是指个人之间的关系网络，这种基于社会网络关系系统思想的网站就是社会性网络网站(SNS网站)。

关于大语言模型驱动的推荐系统智能体的综述

专知会员服务

29+阅读 · 2025年2月17日

定制化大型语言模型的图检索增强生成综述

专知会员服务

38+阅读 · 2025年1月28日

大型语言模型对齐技术综述：RLHF、RLAIF、PPO、DPO 等

专知会员服务

55+阅读 · 2024年7月24日

158页《大型语言模型数据集》全面综述，444个数据集涵盖预训练、指令微调、偏好、评估等，附中英文版

专知会员服务

155+阅读 · 2024年3月1日