AIエージェントに「400枚の商品写真をSKUフォーマットでリネームして、1200x1200にリサイズして、カテゴリ別フォルダに分類して」と頼むと、数秒で終わります。人がやれば2時間かかる作業です。エージェントはどうやってこれをこなすのでしょうか? 答えはCLIです。
これは何?
Ben Tossell(Ben's Bites)が最近のニュースレターで、AIエージェントの仕組みを一文にまとめました: 「エージェントはツールを使えるLLMだ。答えを返すだけでなく、実際に何かができる」。そのツールの最も基本的な形がCLI(Command Line Interface)です。
CLIはテキストでソフトウェアを操作する方法です。コマンドを入力すると何かが実行されます。エージェントはテキストを入出力するので、テキストベースのCLIとの相性は抜群なんです。
最も基本的なのはbash — コンピューターに標準搭載されている汎用コマンドラインです。lsでファイル一覧を確認し、mkdirでフォルダを作り、mvでファイルを移動し、mogrifyで画像をリサイズします。エージェントはこれらのコマンドを組み合わせて複雑な作業を自動処理するわけです。
ただし、bashはあくまでも入口にすぎません。目的別に特化したCLIが存在するからです:
| CLIツール | 用途 | エージェントができること |
|---|---|---|
| bash | 汎用システムコマンド | ファイル管理、スクリプト実行、データ処理 |
| Stripe CLI | 決済/サブスクリプション管理 | 売上データ取得、サブスクリプション管理、決済テスト |
| Playwright | ブラウザ自動化 | Web操作、クリック、フォーム入力、スクリーンショット |
| AWS CLI | クラウドインフラ | サーバー作成、DB管理、スケーリング |
| Vercel CLI | Webデプロイ | ビルドしたサイトを1行でデプロイ |
エージェントに渡すCLIが増えるほど、できることが広がっていきます。Stripe CLIを追加すれば売上データを引き出し、Playwrightを追加すればWebを操作し、Vercelを追加すればビルドしたものをそのままデプロイできます。皆さんの役割は「作業に合ったCLIを選んであげること」です。
何が変わるのか?
2026年現在、ターミナルで動くAIコーディングエージェントだけで15種類以上あります。1年前は「Copilot vs Cursor」の二択でしたが、今は全く別の世界です。
| IDEベースのツール(Cursorなど) | CLIベースのエージェント | |
|---|---|---|
| 作業方式 | コード提案、オートコンプリート | 計画 → 実行 → 検証まで自律 |
| 対象範囲 | エディター内のコードのみ | ファイル、ターミナル、git、外部API全部 |
| 自律性 | 人が承認 | エージェントが自動的に繰り返し実行 |
| 拡張性 | プラグインエコシステム | どのCLIでもツールとして追加可能 |
Temboの比較分析によると、CLIコーディングエージェントは大きく3つのグループに分かれます:
Aiderは39K+のGitHubスターと週150億トークンの処理量で最大のユーザーベースを誇り、OpenCodeは95K+スターで急成長中です。Gemini CLIは無料ティア(1分あたり60件、1日1,000件)で参入ハードルが最も低くなっています。
始め方のポイント
- 今使っているモデルを基準に選ぶ
Anthropic → Claude Code、OpenAI → Codex、Google → Gemini CLI。特定モデルに絞っているなら、まずネイティブツールから始めてみてください。 - 無料で始めたいならGemini CLI
Googleアカウントでログインするだけで1日1,000件が無料。1Mトークンのコンテキストウィンドウは大規模コードベースに有利です。 - モデルの柔軟性を重視するならAiderまたはOpenCode
ほぼすべてのLLMをサポートし、オープンソースなので無料で使えます。モデルの費用だけ自分で負担すればOKです。 - 目的別CLIツールを追加して拡張する
コーディングエージェントにStripe CLI、Playwright、Vercel CLIのような専門ツールを加えると、できることが飛躍的に広がります。
選び方のまとめ
自律性を求めるなら → Claude Code、Droid、Warp
人の承認を重視するなら → Cline(VS Code)、Kiro(仕様ベース)
予算ゼロなら → Gemini CLI、Aider、Goose、OpenCode



