SYMPHONY_ Synergistic Multi-agent Planning with Heterogeneous Language Model Assembly
SYMPHONY:多智能体协同规划使用多样的大语言模型集群
发表时间:202601
会议/期刊:Neurips 2026
作者:Wei Zhu Yunnan University
论文链接:https://arxiv.org/pdf/2601.22623
代码/数据集链接:
Tag:Multi-Agent;Agent Planning
ABSTRACT
现在使用 llm 构造自动化的 agent 去解决复杂任务
现存方法实用单一 agent 框架去生成搜索分支并且估计奖励在 MCTS(Monte carlo tree search)规划期间
为了解决这个限制,我们提出了 Synergistic Mutli-Agent Planning with Heterogeneous LaNguage model assembly(SYMPHONY),一个新颖的规划框架,集成一个池基于异构 LLM Agents。
通过充分利用 Agent 多样化的推理模式,SYMPHONY 增强首次出现的差异和促进更多有效拓展
以经验为依据的多个 benchmark 任务结果展示了 SYMPHONY 杰出的性能(甚至当开源模型部署在消费者级别的硬件上),当使用云端 api,SYMPHONY 证明显著提升,超越 sota 并且强调了规划任务中的异构多智能体协调的效果。
PROBLEM TO SOLVE
problem description:
MDP:MarKov Decision Process
MCTS
Limitations of Existing Methods
METHOD
overview

pipeline
1.Heterogeneous Agent Pool:增强推送多样化,通过多样的有意向的归纳和推理行为(不像 MCTS)。
2.Agent 调度:整合一个自适应调度机制,建立在 Vpper Confidence Bound 准则,制定 agent 选择在 MCTS 推送机制作为结构性多武装土匪问题
3.智能池记忆分享:agents update their behavior by integrating peer-generated reflections into prompt-level memory
4.熵调制节点评价:调节阈值,优化效果。
CONTRIBUTION
Claimed Contributions
ProPosed by the author
a multi-agent planning framework that combines MCTS with a diverse pool of language models.
SYMPHONY improves both search diversity and planning effectiveness.
Personal Assessment
My opinion: Novelty(new tasks? new dateset? new concept? innovation? new gap? new theory? Combinatorial methods? )
Combinatorial methods
EXPERIMENTATION


Limitation
调阈值真的可靠吗?我的理解就是,做数据集的适配。不过好多顶会的文章都是这么做的,包括 ai 的,安全四大,说明肯定是具有可行性的。