让 AI 智能体去"把 400 张产品照片按 SKU 格式重命名,统一缩放到 1200x1200,再按类别分好文件夹",几秒钟就完事了——换成人来做,至少两小时。智能体是怎么做到的?答案就是 CLI。

3秒速览
AI 智能体 = LLM + 工具 工具的核心 = CLI bash、Stripe、Playwright 等 工具越多,能力越强 15+ 款 CLI 编程智能体对比

这是什么?

Ben Tossell(Ben's Bites)最近在一期 Newsletter 里用一句话概括了 AI 智能体的工作原理:"智能体就是会用工具的 LLM。它不只是回答问题,而是能真正去做事"。而这些工具里最基础的一种,就是 CLI(Command Line Interface,命令行界面)。

CLI 就是用文本指令来操作软件的方式。输一行命令,某件事就被执行。智能体的输入输出本来就是文本,所以和纯文本驱动的 CLI 简直是天生一对。

最基础的 CLI 是 bash——电脑里自带的通用命令行。用 ls 查看文件,用 mkdir 建文件夹,用 mv 移动文件,用 mogrify 批量缩放图片。智能体就是把这些命令组合起来,自动跑完一整套复杂流程。

不过 bash 只是起点。针对不同任务,还有各种专门的 CLI:

CLI 工具用途智能体能做什么
bash通用系统命令文件管理、脚本执行、数据处理
Stripe CLI支付/订阅管理查营收数据、管订阅、测支付流程
Playwright浏览器自动化网页导航、点击、填表单、截图
AWS CLI云基础设施创建服务器、管理数据库、弹性扩缩
Vercel CLI网站部署一行命令把构建好的站点发出去

给智能体配的 CLI 越多,它能干的事就越多。加个 Stripe CLI 它就能拉营收,加个 Playwright 它就能逛网页,再加个 Vercel 它连构建产物一起部署都包了。你的工作,就是"给任务挑对应的 CLI"。

有什么不同?

到 2026 年为止,光是跑在终端里的 AI 编程智能体就超过 15 款。一年前大家还在讨论"Copilot 还是 Cursor",现在已经是完全不一样的世界了。

IDE 类工具(Cursor 等)CLI 类智能体
工作方式代码建议、自动补全规划 → 执行 → 验证全自主
作用范围仅限编辑器里的代码文件、终端、git、外部 API 全都能碰
自主性每步人来批准智能体自己循环执行
扩展性靠插件生态任何 CLI 都能接进来当工具

Tembo 的对比分析把 CLI 编程智能体大致分成三类:

1/3

大厂原生系

Claude Code(Anthropic)、Codex(OpenAI)、Gemini CLI(Google)、Copilot CLI(GitHub)。强项是和自家模型的深度集成。

2/3

独立/创业公司

Amp(Sourcegraph)、Aider、Warp、Augment、Droid(Factory)。靠专门的工作流和独有功能打市场。

3/3

开源/社区系

OpenCode(9.5 万+ star)、Goose(Block)、Crush、Cline、Kilo。卖点是模型自由度和扩展性。

Aider 拥有 3.9 万+ GitHub star 和每周 150 亿 token 的处理量,用户基础最大;OpenCode 则靠 9.5 万+ star 快速崛起。Gemini CLI 以免费额度(每分钟 60 次、每天 1000 次)把门槛压到最低。

上手指南

  1. 按你现在用的模型来挑
    Anthropic → Claude Code,OpenAI → Codex,Google → Gemini CLI。已经全押在某个模型上的话,先从原生工具入手。
  2. 想免费用就选 Gemini CLI
    谷歌账号登录就能每天白嫖 1000 次。100 万 token 的上下文窗口对付大型代码库很有优势。
  3. 看重模型灵活性就选 Aider 或 OpenCode
    几乎支持所有 LLM,开源免费。只用自己承担模型调用费用。
  4. 加上专用 CLI 工具继续扩展
    给编程智能体再接上 Stripe CLI、Playwright、Vercel CLI 这类专业工具,能干的事会成倍增加。

选型速查

想要高自主性 → Claude Code、Droid、Warp
需要人工把关 → Cline(VS Code)、Kiro(基于规格)
预算为零 → Gemini CLI、Aider、Goose、OpenCode