Claude Code 代码库分析：Agent 可靠性工程才是真正的护城河

基于对 Claude Code 代码库的分析，评估几个核心方向的表现。

Agent 可靠性工程：做得最好，也是核心差异化

这是 Claude Code 真正的护城河，从代码上就能看出投入最深：

Task.ts 里的状态机设计就是最好的证明：

1
2
3

TaskType: local_bash | local_agent | remote_agent
          | in_process_teammate | local_workflow | monitor_mcp | dream
TaskStatus: pending → running → completed / failed / killed

做到了竞品没做到的事：

AI 任务崩了会自动重试，而不是“报错让你重来”
权限申请透明，用户知道 AI 在做什么
任务状态可观测、可中断、可恢复
多 Agent 协作（teammate 模式）

这才是“把不完美的布料裁剪好”的核心工程——让不稳定的 AI 变成可信赖的工具。

Evaluation & Observability：做得相当扎实

代码里有 cost-tracker.ts、diagnosticTracking.ts、startupProfiler、完整的 analytics 体系。但这个方向更多是内部工具，用户感知不强，主要是 Anthropic 团队自己用来优化产品的。

竞品在这方面普遍偷懒，而 Claude Code 做了——这是保证产品持续迭代质量的基础。

Model Routing：有做，但是浅

代码里有 fastMode（快速模式切换小模型）、model.ts（模型选择）、advisor（建议模式用不同模型）。

但这更像是简单的规则路由，而不是真正的智能路由：

不是根据任务复杂度动态选模型
更多是用户手动指定 + 预设规则

这个方向目前是够用但不出彩。