多Agent编排
Chief-Deputy-Specialist三层架构:防上下文爆炸、控成本、清晰分工——这才是真正的多Agent编排。
核心论点
Claude Code的Sub-agents不算行业期待的"多Agent编排",只能算是一种多代理机制——内部任务路由加轻量委托,入门级,只适合简单场景。
真正的多Agent编排有五个特征:
- 层次化与嵌套编排:支持meta-orchestrator管理子orchestrator,形成"团队中的团队"(hierarchical/swarm结构),允许复杂委托链和辩论/审核机制
- 多模型/跨提供商支持:不同Agent用不同模型(Opus规划、Flash执行、Grok搜索),优化成本与性能的平衡
- 共享状态与高级协调:持久记忆、冲突解决、动态路由、循环迭代、错误恢复,由外部代码或框架管理
- 真正并行与扩展性:支持数十甚至数百Agent并发,适用于长运行、大规模任务
- 开源/可编程灵活性:开发者用代码定义workflow,而不是依赖单一LLM的自然语言委托
三层架构的实践方案:
Chief(主Agent) — 战略层,负责理解最终目标和整体方向。使用最好的模型(如Opus)。不直接执行,不直接派发子任务。
Deputy(副手) — 管理层,接收Chief指令,分解为具体子任务,派发给Specialist,汇总过滤结果后返回给Chief。类比CEO和COO:执行的活儿让副手干。
Specialist(专家Agent) — 执行层,各司其职:Researcher做情报、Writer做创作、Editor做润色、Archivist管知识库。
为什么需要Deputy这一层?
- 防上下文爆炸:如果全由Chief派发并回收,上下文窗口很可能撑爆。Deputy作为中间层可以汇总过滤,大幅减少Chief的上下文负担
- 控制成本:Chief用最好的模型,Deputy用便宜一点的,专家Agent按任务类型选模型
- 清晰分工:战略与执行分离,每个层级只做自己该做的事
质量控制机制: 给每个专业Agent加多维度质量评分。Researcher评估覆盖度、来源质量和相关性;Writer评估结构、清晰度和有据可依。分数≥0.8可以交给下一个Agent;0.5-0.79自我优化;<0.5重做。系统精确指出最弱维度并给出改进建议,而不是笼统地说"再试一次"。
来源
- 03 - OUTPUT/01 - Note/Claude Code的Sub-agents并不算行业所期待的"多Agent编排" — 真正多Agent编排的五个特征
- 03 - OUTPUT/01 - Note/newtype Profile的多Agent编排框架 — Chief-Deputy架构的设计原理
- 03 - OUTPUT/01 - Note/多Agent编排中,怎么判断子Agent的执行质量? — 质量评分机制
相关概念
- AI OS — 多Agent编排是个人AI OS的执行引擎
- Harness Engineering — 多Agent编排是Harness Engineering在任务执行层的具体实现
- 领域知识+领域经验 — Specialist Agent的能力来源:领域知识(RAG)+ 领域经验(Skills)
演变
多Agent编排从学术概念(swarm intelligence、multi-agent systems)进入工程实践,经历了从框架炒作(AutoGPT等)到工程务实(OpenAI Swarm、Anthropic Agent实践)的演变。Chief-Deputy-Specialist三层架构是在实际使用中针对上下文和成本双重压力推导出的实用解法。
Substack 相关文章
- 什么是Harness Engineering2026-03-28