面向群体审议的多智能体对话模型在复杂推理中的应用 (Group Deliberation Oriented Multi-Agent Conversational Model for Complex Reasoning) - 专知论文

会员服务 ·

0

复杂推理 · 一致 · 智能体 · 外部知识 · 知识 ·

2025 年 12 月 31 日

Group Deliberation Oriented Multi-Agent Conversational Model for Complex Reasoning

翻译：面向群体审议的多智能体对话模型在复杂推理中的应用

Zheyu Shi,Dong Qiu,Shanlong Yu

from arxiv, Accepted by IEEE ITCA 2025

This paper proposes a group deliberation oriented multi-agent conversational model to address the limitations of single large language models in complex reasoning tasks. The model adopts a three-level role division architecture consisting of generation, verification, and integration. An opinion generation agent produces diverse reasoning perspectives, an evidence verification agent retrieves external knowledge and quantifies factual support, and a consistency arbitration agent integrates logically coherent conclusions. A self-game mechanism is introduced to expand multi-path reasoning trajectories, while a retrieval enhancement module dynamically supplements external knowledge. A composite reward function combining factual consistency and logical coherence is designed, and an improved proximal policy optimization strategy is applied for collaborative training. Experimental results show that the proposed model improves multi-hop reasoning accuracy by 16.8 percent on HotpotQA, 14.3 percent on 2WikiMultihopQA, and 19.2 percent on MeetingBank, while improving consistency by 21.5 percent. The model achieves higher reasoning efficiency than mainstream multi-agent approaches, providing an effective and stable solution for complex reasoning tasks.

翻译：本文提出一种面向群体审议的多智能体对话模型，以解决单一大型语言模型在复杂推理任务中的局限性。该模型采用生成、验证与整合的三级角色划分架构：观点生成智能体产生多样化的推理视角，证据验证智能体检索外部知识并量化事实支持度，一致性仲裁智能体整合逻辑自洽的结论。通过引入自博弈机制扩展多路径推理轨迹，同时采用检索增强模块动态补充外部知识。设计了融合事实一致性与逻辑连贯性的复合奖励函数，并应用改进的近端策略优化策略进行协同训练。实验结果表明，所提模型在HotpotQA上的多跳推理准确率提升16.8%，在2WikiMultihopQA上提升14.3%，在MeetingBank上提升19.2%，同时将一致性指标提升21.5%。该模型相比主流多智能体方法具有更高的推理效率，为复杂推理任务提供了有效且稳定的解决方案。

0

相关内容

复杂推理

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

31+阅读 · 2月2日

大语言模型的智能体化推理

大语言模型的智能体化推理

专知会员服务

32+阅读 · 1月21日

从感知到推理：深度思考赋能多模态大语言模型

从感知到推理：深度思考赋能多模态大语言模型

专知会员服务

24+阅读 · 2025年11月19日

基于大语言模型（LLM）的智能体推理框架：从方法到场景的综述

基于大语言模型（LLM）的智能体推理框架：从方法到场景的综述

专知会员服务

52+阅读 · 2025年8月26日

【ICML2025】通过多智能体反思强化大语言模型推理

【ICML2025】通过多智能体反思强化大语言模型推理

专知会员服务

22+阅读 · 2025年6月11日

感知、推理、思考与规划：大型多模态推理模型综述

感知、推理、思考与规划：大型多模态推理模型综述

专知会员服务

39+阅读 · 2025年5月10日

大语言模型推理前沿综述：推理扩展、推理学习与智能体系统

大语言模型推理前沿综述：推理扩展、推理学习与智能体系统

专知会员服务

37+阅读 · 2025年4月20日

多智能体协作机制：大语言模型综述

多智能体协作机制：大语言模型综述

专知会员服务

84+阅读 · 2025年1月14日

【大模型对齐】利用对齐使大型语言模型更好地推理

【大模型对齐】利用对齐使大型语言模型更好地推理

专知会员服务

48+阅读 · 2023年9月8日

「大型语言模型推理」综述

「大型语言模型推理」综述

专知会员服务

95+阅读 · 2022年12月24日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

深思考人工智能蝉联SMP2018多轮语义对话冠军，报告解读多轮人机对话实现过程

深思考人工智能蝉联SMP2018多轮语义对话冠军，报告解读多轮人机对话实现过程

人工智能学家

15+阅读 · 2018年8月4日

多轮对话之对话管理：Dialog Management

多轮对话之对话管理：Dialog Management

PaperWeekly

18+阅读 · 2018年1月15日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

多层动态网络的建模、群体动力学分析与控制

国家自然科学基金

3+阅读 · 2015年12月31日

复杂决策环境下面向共识的群体评价模型与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

社交网络中信息主体的行为模式分析及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

20+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Agentic Proposing: Enhancing Large Language Model Reasoning via Compositional Skill Synthesis

Arxiv

0+阅读 · 2月3日

Collaborative Belief Reasoning with LLMs for Efficient Multi-Agent Collaboration

Arxiv

0+阅读 · 1月30日

Exploring Reasoning Reward Model for Agents

Exploring Reasoning Reward Model for Agents

Arxiv

0+阅读 · 1月29日

AgenticSimLaw: A Juvenile Courtroom Multi-Agent Debate Simulation for Explainable High-Stakes Tabular Decision Making

Arxiv

0+阅读 · 1月29日

MetaGen: Self-Evolving Roles and Topologies for Multi-Agent LLM Reasoning

Arxiv

0+阅读 · 1月27日

Collaborative Belief Reasoning with LLMs for Efficient Multi-Agent Collaboration

Arxiv

0+阅读 · 1月24日

A Comprehensive Evaluation of LLM Reasoning: From Single-Model to Multi-Agent Paradigms

Arxiv

0+阅读 · 1月19日

Orchestrating Intelligence: Confidence-Aware Routing for Efficient Multi-Agent Collaboration across Multi-Scale Models

Arxiv

0+阅读 · 1月8日

When Identity Skews Debate: Anonymization for Bias-Reduced Multi-Agent Reasoning

Arxiv

0+阅读 · 1月7日

Understanding Multi-Agent Reasoning with Large Language Models for Cartoon VQA

Understanding Multi-Agent Reasoning with Large Language Models for Cartoon VQA

Arxiv

0+阅读 · 1月6日

VIP会员

文章信息

相关主题

相关VIP内容

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

31+阅读 · 2月2日

大语言模型的智能体化推理

大语言模型的智能体化推理

专知会员服务

32+阅读 · 1月21日

从感知到推理：深度思考赋能多模态大语言模型

从感知到推理：深度思考赋能多模态大语言模型

专知会员服务

24+阅读 · 2025年11月19日

基于大语言模型（LLM）的智能体推理框架：从方法到场景的综述

基于大语言模型（LLM）的智能体推理框架：从方法到场景的综述

专知会员服务

52+阅读 · 2025年8月26日

【ICML2025】通过多智能体反思强化大语言模型推理

【ICML2025】通过多智能体反思强化大语言模型推理

专知会员服务

22+阅读 · 2025年6月11日

感知、推理、思考与规划：大型多模态推理模型综述

感知、推理、思考与规划：大型多模态推理模型综述

专知会员服务

39+阅读 · 2025年5月10日

大语言模型推理前沿综述：推理扩展、推理学习与智能体系统

大语言模型推理前沿综述：推理扩展、推理学习与智能体系统

专知会员服务

37+阅读 · 2025年4月20日

多智能体协作机制：大语言模型综述

多智能体协作机制：大语言模型综述

专知会员服务

84+阅读 · 2025年1月14日

【大模型对齐】利用对齐使大型语言模型更好地推理

【大模型对齐】利用对齐使大型语言模型更好地推理

专知会员服务

48+阅读 · 2023年9月8日

「大型语言模型推理」综述

「大型语言模型推理」综述

专知会员服务

95+阅读 · 2022年12月24日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

深思考人工智能蝉联SMP2018多轮语义对话冠军，报告解读多轮人机对话实现过程

深思考人工智能蝉联SMP2018多轮语义对话冠军，报告解读多轮人机对话实现过程

人工智能学家

15+阅读 · 2018年8月4日

多轮对话之对话管理：Dialog Management

多轮对话之对话管理：Dialog Management

PaperWeekly

18+阅读 · 2018年1月15日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

Agentic Proposing: Enhancing Large Language Model Reasoning via Compositional Skill Synthesis

Arxiv

0+阅读 · 2月3日

Collaborative Belief Reasoning with LLMs for Efficient Multi-Agent Collaboration

Arxiv

0+阅读 · 1月30日

Exploring Reasoning Reward Model for Agents

Exploring Reasoning Reward Model for Agents

Arxiv

0+阅读 · 1月29日

AgenticSimLaw: A Juvenile Courtroom Multi-Agent Debate Simulation for Explainable High-Stakes Tabular Decision Making

Arxiv

0+阅读 · 1月29日

MetaGen: Self-Evolving Roles and Topologies for Multi-Agent LLM Reasoning

Arxiv

0+阅读 · 1月27日

Collaborative Belief Reasoning with LLMs for Efficient Multi-Agent Collaboration

Arxiv

0+阅读 · 1月24日

A Comprehensive Evaluation of LLM Reasoning: From Single-Model to Multi-Agent Paradigms

Arxiv

0+阅读 · 1月19日

Orchestrating Intelligence: Confidence-Aware Routing for Efficient Multi-Agent Collaboration across Multi-Scale Models

Arxiv

0+阅读 · 1月8日

When Identity Skews Debate: Anonymization for Bias-Reduced Multi-Agent Reasoning

Arxiv

0+阅读 · 1月7日

Understanding Multi-Agent Reasoning with Large Language Models for Cartoon VQA

Understanding Multi-Agent Reasoning with Large Language Models for Cartoon VQA

Arxiv

0+阅读 · 1月6日

相关基金

多层动态网络的建模、群体动力学分析与控制

国家自然科学基金

3+阅读 · 2015年12月31日

复杂决策环境下面向共识的群体评价模型与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

社交网络中信息主体的行为模式分析及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

20+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员