1年前にAIがコードの25%を書いていた開発者が、8ヶ月後には90%を任せています。IDEも捨てたそうです。50年前のViに戻ったんです。
これは何?
David CrawshawはTailscaleの共同創業者出身です。exe.devというエージェントプラットフォームを作っており、AIコーディングエージェントに関する実践記録を1年以上連載してきました。最初の記事がHN 919点、2番目が615点、今回3番目が223点を獲得し、開発者コミュニティで最も率直な実践レポートとして注目されています。
核心はこれです。エージェントのハーネス(ツール)は1年間ほとんど変わっていないのに、モデルだけが劇的に良くなったということです。Crawshawが作ったエージェントSketchが6ヶ月前にできていたことを、人気エージェントがまだできないケースがあるそうです。結局、ツールではなくモデルが核心だということです。
公開ベンチマークはすべて操作済みなので無視するようにとまで言っています。その代わり、質的な変化に注目するよう促しています。GPT-2が初めて言葉を話したような劇的な瞬間はなかったけれど、着実な改善が積み重なって、今ではコードの90%を任せられるレベルになったと言います。
何が変わるのか?
最も衝撃的な変化はIDEの退場です。2021年にCopilotが登場したとき、IDEは必須でしたよね。自動補完とインライン編集のおかげでタイピング効率が50%上がりましたから。ところが4年後、エージェント時代にはIDEが必要なくなりました。エージェントはターミナルとコードベースへのアクセスさえあれば十分なんです。
| Copilot時代(2021〜2024) | エージェント時代(2025〜) | |
|---|---|---|
| メインツール | VS Code + Copilot | ターミナル + Claude Code/Codex |
| 開発者の役割 | コード作成 + AI補助 | コードレビュー + エージェント指示 |
| AI貢献度 | タイピング効率50%↑ | コードの90%を直接作成 |
| 時間配分 | 読み50% / 書き50% | 読み95% / 書き5% |
| エディタ | IDE必須 | Vi/Neovimで十分 |
もう一つの重要な変化はプログラムの数です。以前はApple Notesに「TODO」と書いておいて忘れていたアイデアが、今は実際に作られるようになったそうです。Crawshaw自身は、プログラミングがかつてないほど楽しいと言っています。作りたかったプログラムが実際に存在するようになったからです。
HNのコメントでは強い反論も出ました。ある開発者は、同僚がAIで作り出すコードがテストもされていないslopだと言い、「ガスライティングされている気分」と書いていました。 コーディング速度が本当のボトルネックではなく、PRレビュー、CI/CDプロセス、IAM権限といった組織プロセスがボトルネックだという意見も多かったです。あるコメントはこうまとめていました:AIが5日のプロセスを4.9日に縮めてくれた、と。
始め方のポイント
- フロンティアモデルから使ってください
Crawshawの最も強いアドバイスです。安いモデルを使うと「間違った教訓」を学ぶそうです。エージェントの限界は常に変わっているため、最新フロンティアモデルの能力を正確に把握してこそ、どこまで任せられるか判断できます。 - ビルトインサンドボックスをオフにしてVMを使ってください
Claude Codeの「cat foo.txtを実行してもいいですか?」というプロンプトが生産性を下げます。セッションごとに新しいVMを立ち上げて、エージェントに制約なく働かせる方がずっとうまくいきます。 - コードを書くのではなく、読む練習をしてください
時間配分が95:5に変わりました。エージェントが書いたコードを速く正確にレビューする能力が、新たなコアスキルです。 - 「プログラマーにとって最高のソフトウェアが、すべてのユーザーにとっても最高」という原則を覚えておいてください
Crawshawの核心的な哲学です。すべての顧客にエージェントが生まれると、APIと開発者体験がそのままユーザー体験になります。プロダクトを作っているなら、UIよりAPIを先に作りましょう。
CrawshawのStripe Sigma事例
StripeがSQLクエリシステム(Sigma)と内蔵LLMアシスタントをリリースしたとき、APIエンドポイントはまだ非公開アルファだったそうです。そこでエージェントに3文の指示だけで、Stripe API → ローカルSQLite → 独自クエリシステムを作らせました。Stripeのプロダクトより自分の問題をうまく解決できたと言います。
HNコミュニティの現実チェック
エージェントの体験は個人差が極めて大きいです。パワーユーザーであるCrawshawのような人は10倍の生産性を体験しますが、大多数の開発者はまだそのレベルに達していません。 ワークフローをエージェント中心に完全に再設計しなければ、ツールを変えるだけでは効果を得にくいのが現実です。



