基于对 Claude Code 代码库的分析,评估几个核心方向的表现。
Agent 可靠性工程:做得最好,也是核心差异化
这是 Claude Code 真正的护城河,从代码上就能看出投入最深:
Task.ts 里的状态机设计就是最好的证明:
1 | TaskType: local_bash | local_agent | remote_agent |
做到了竞品没做到的事:
- AI 任务崩了会自动重试,而不是“报错让你重来”
- 权限申请透明,用户知道 AI 在做什么
- 任务状态可观测、可中断、可恢复
- 多 Agent 协作(teammate 模式)
这才是“把不完美的布料裁剪好”的核心工程——让不稳定的 AI 变成可信赖的工具。
Evaluation & Observability:做得相当扎实
代码里有 cost-tracker.ts、diagnosticTracking.ts、startupProfiler、完整的 analytics 体系。但这个方向更多是内部工具,用户感知不强,主要是 Anthropic 团队自己用来优化产品的。
竞品在这方面普遍偷懒,而 Claude Code 做了——这是保证产品持续迭代质量的基础。
Model Routing:有做,但是浅
代码里有 fastMode(快速模式切换小模型)、model.ts(模型选择)、advisor(建议模式用不同模型)。
但这更像是简单的规则路由,而不是真正的智能路由:
- 不是根据任务复杂度动态选模型
- 更多是用户手动指定 + 预设规则
这个方向目前是够用但不出彩。