让 AI 智能体去"把 400 张产品照片按 SKU 格式重命名,统一缩放到 1200x1200,再按类别分好文件夹",几秒钟就完事了——换成人来做,至少两小时。智能体是怎么做到的?答案就是 CLI。
这是什么?
Ben Tossell(Ben's Bites)最近在一期 Newsletter 里用一句话概括了 AI 智能体的工作原理:"智能体就是会用工具的 LLM。它不只是回答问题,而是能真正去做事"。而这些工具里最基础的一种,就是 CLI(Command Line Interface,命令行界面)。
CLI 就是用文本指令来操作软件的方式。输一行命令,某件事就被执行。智能体的输入输出本来就是文本,所以和纯文本驱动的 CLI 简直是天生一对。
最基础的 CLI 是 bash——电脑里自带的通用命令行。用 ls 查看文件,用 mkdir 建文件夹,用 mv 移动文件,用 mogrify 批量缩放图片。智能体就是把这些命令组合起来,自动跑完一整套复杂流程。
不过 bash 只是起点。针对不同任务,还有各种专门的 CLI:
| CLI 工具 | 用途 | 智能体能做什么 |
|---|---|---|
| bash | 通用系统命令 | 文件管理、脚本执行、数据处理 |
| Stripe CLI | 支付/订阅管理 | 查营收数据、管订阅、测支付流程 |
| Playwright | 浏览器自动化 | 网页导航、点击、填表单、截图 |
| AWS CLI | 云基础设施 | 创建服务器、管理数据库、弹性扩缩 |
| Vercel CLI | 网站部署 | 一行命令把构建好的站点发出去 |
给智能体配的 CLI 越多,它能干的事就越多。加个 Stripe CLI 它就能拉营收,加个 Playwright 它就能逛网页,再加个 Vercel 它连构建产物一起部署都包了。你的工作,就是"给任务挑对应的 CLI"。
有什么不同?
到 2026 年为止,光是跑在终端里的 AI 编程智能体就超过 15 款。一年前大家还在讨论"Copilot 还是 Cursor",现在已经是完全不一样的世界了。
| IDE 类工具(Cursor 等) | CLI 类智能体 | |
|---|---|---|
| 工作方式 | 代码建议、自动补全 | 规划 → 执行 → 验证全自主 |
| 作用范围 | 仅限编辑器里的代码 | 文件、终端、git、外部 API 全都能碰 |
| 自主性 | 每步人来批准 | 智能体自己循环执行 |
| 扩展性 | 靠插件生态 | 任何 CLI 都能接进来当工具 |
Tembo 的对比分析把 CLI 编程智能体大致分成三类:
Aider 拥有 3.9 万+ GitHub star 和每周 150 亿 token 的处理量,用户基础最大;OpenCode 则靠 9.5 万+ star 快速崛起。Gemini CLI 以免费额度(每分钟 60 次、每天 1000 次)把门槛压到最低。
上手指南
- 按你现在用的模型来挑
Anthropic → Claude Code,OpenAI → Codex,Google → Gemini CLI。已经全押在某个模型上的话,先从原生工具入手。 - 想免费用就选 Gemini CLI
谷歌账号登录就能每天白嫖 1000 次。100 万 token 的上下文窗口对付大型代码库很有优势。 - 看重模型灵活性就选 Aider 或 OpenCode
几乎支持所有 LLM,开源免费。只用自己承担模型调用费用。 - 加上专用 CLI 工具继续扩展
给编程智能体再接上 Stripe CLI、Playwright、Vercel CLI 这类专业工具,能干的事会成倍增加。
选型速查
想要高自主性 → Claude Code、Droid、Warp
需要人工把关 → Cline(VS Code)、Kiro(基于规格)
预算为零 → Gemini CLI、Aider、Goose、OpenCode




