Claude Code「创建认证系统」,代码就弹出来了。但你怎么审查那段代码?你是在翻终端滚动,眼睛扫过,然后敲「第3个函数用argon2id而不是bcrypt」吗?

Pydantic团队的Laura Summers把这称为「监督疲劳(supervision fatigue)」。AI生成大量"差不多对"的代码,人类逐一验证的新型疲劳感。Martin Fowler团队为这个问题提出了「human on the loop」的框架。不是逐行检查代码,而是设计让代理更好运作的系统(harness),这才是开发者的新角色

Crit是正面解决这个问题的CLI工具。不管是AI代理制作的计划还是代码变更,都可以像GitHub PR一样在浏览器中留下内联评论,自动将反馈传递给代理。

这是什么?

Crit是波兰开发者Tomasz Tomczyk创建的开源CLI工具。他在使用Claude CodeCursor时,遇到"看起来像对但其实是错的代码(plausible-but-wrong)",发现没有不创建PR就能结构化反馈的方法,于是自己创建了这个工具。

Crit的工作方式
运行crit plan.md(或crit)→ 浏览器中打开文件 → 点击/拖动行号选择范围 → 写下内联评论 → 点击Finish Review → 代理自动接收反馈 → 修改后显示diff → 重复

关键是Review循环(review loop)。留下评论点击Finish Review后,代理自动接收反馈修改代码,Crit再次显示变更的diff。上一轮的评论也原封不动保留,方便确认有没有遗漏。与Claude Code、Cursor、GitHub Copilot、Aider、Cline、Windsurf等所有能读取文件的代理兼容。

有什么变化?

AI代码Review工具已经很多了。CodeRabbit、Qodo、GitHub Copilot PR Review等。但这些是AI Review AI的工具。Crit方向相反。是人类Review AI的工具。

方式方向特点
GitHub PR Review人类 → 人类运行良好,但AI代理工作中途创建PR太重
CodeRabbit、Qodo等AI → AI(人类监督)PR提交后自动Review。无法在代理工作中途介入
Crit人类 → AI代理写代码的过程中内联反馈。本地运行,零安装依赖

Addy Osmani(Google Chrome团队)在2026年的编程工作流文章中说「把AI写的代码当作初级工程师写的来处理」。读、运行、测试。问题在于「读」的过程没有结构化,Crit正好填补了这个空白。

实际用户反馈很亮眼
Pitch的Engineering Manager Ullrich Schäfer说「每天用Crit让代理反馈循环更紧密。能Review计划的特定部分,让AI编程变得既快速又可控」。资深工程师Vincent评价「就像对计划做PR Review。以前要针对长计划的第3个点这样改、第7个点删掉,现在一个评论就搞定了」。

如何开始

现在就可以用。单一二进制文件,没有依赖。

  1. 安装(10秒)
    Homebrew: brew install tomasz-tomczyk/tap/crit
    Go: go install github.com/tomasz-tomczyk/crit@latest
    或从GitHub Releases直接下载二进制文件
  2. 开始Review计划
    运行crit plan.md或crit(自动检测变更)后浏览器打开。点击或拖动行号留下内联评论。支持Vim键位绑定,j/k移动,c评论,Shift+F完成Review。
  3. 连接代理
    Claude Code、Cursor、OpenCode、GitHub Copilot支持/crit斜杠命令。运行后Crit启动,Review结束后代理自动接收反馈并修改。其他代理只要能读取文件都可以兼容。
  4. Review代码变更(git diff)
    不只是计划,也可以Review实际的代码变更。只运行crit就能检测git变更并以split/unified diff视图显示。也可以按轮次比较diff,方便确认「上次的反馈有没有被采纳?」
本地优先,也支持共享
基本只在本地运行,但也可以用Share Review功能创建公开链接。方便发给团队成员说「这个计划你怎么看?」。评论按作者颜色区分,随时可以Unpublish。需要完全自主托管的话也可以用Docker Compose启动crit-web。

想深入了解

为什么AI编程的质量管理这么难

根据Qodo 2026年的代码Review分析,AI编程代理让开发者生产力提升了25~35%,但Review人员能验证的量没变。PR越来越大,架构漂移越来越严重,资深工程师埋没在验证工作而非系统设计中。

Berkeley Haas的研究揭示,AI不是减少工作而是增加强度。Pydantic的Douwe每天早上Review AI创建的30个PR,自问「如果把这个也交给AI,我在这里做什么?」。Crit这样的工具受关注,是因为它结构化了这种监督疲劳。