Claude Code 代码库分析:Agent 可靠性工程才是真正的护城河

基于对 Claude Code 代码库的分析,评估几个核心方向的表现。


Agent 可靠性工程:做得最好,也是核心差异化

这是 Claude Code 真正的护城河,从代码上就能看出投入最深:

Task.ts 里的状态机设计就是最好的证明:

1
2
3
TaskType: local_bash | local_agent | remote_agent
| in_process_teammate | local_workflow | monitor_mcp | dream
TaskStatus: pending → running → completed / failed / killed

做到了竞品没做到的事:

  • AI 任务崩了会自动重试,而不是“报错让你重来”
  • 权限申请透明,用户知道 AI 在做什么
  • 任务状态可观测、可中断、可恢复
  • 多 Agent 协作(teammate 模式)

这才是“把不完美的布料裁剪好”的核心工程——让不稳定的 AI 变成可信赖的工具。


Evaluation & Observability:做得相当扎实

代码里有 cost-tracker.tsdiagnosticTracking.tsstartupProfiler、完整的 analytics 体系。但这个方向更多是内部工具,用户感知不强,主要是 Anthropic 团队自己用来优化产品的。

竞品在这方面普遍偷懒,而 Claude Code 做了——这是保证产品持续迭代质量的基础。


Model Routing:有做,但是浅

代码里有 fastMode(快速模式切换小模型)、model.ts(模型选择)、advisor(建议模式用不同模型)。

但这更像是简单的规则路由,而不是真正的智能路由:

  • 不是根据任务复杂度动态选模型
  • 更多是用户手动指定 + 预设规则

这个方向目前是够用但不出彩