AI Agent Memory 2026 — mem0, Letta, OpenAI Memory 비교

framerusercontent.com

AIエージェントのメモリがインフラになった — mem0・Letta・OpenAI Memory、それぞれの選択

mem0、Letta、OpenAI Memory、AIエージェントメモリ、LOCOMOベンチマーク開発

The State of AI Agent Memory in 2026

Mem0 vs Letta vs MemGPT 2026

Best AI Agent Memory Tools 2026

これまでAIエージェントの「記憶」は、ツールの中に組み込まれた付属品でした。ChatGPTのMemory機能や、LangChainのConversationBufferMemoryのように。ところが2026年に入って流れが変わりました。メモリそのものが独立したインフラカテゴリになり、mem0はGitHub 47.8Kスターを獲得してシリーズA 2,400万ドルを調達しました。 Lettaはフルスタックエージェントランタイムとしてのポジションをとり、OpenAI MemoryはChatGPT内に独自ソリューションを組み込みました。3者がそれぞれ異なる答えを持ち出す中、精度とレイテンシを同時に測定したLOCOMOベンチマークが初めて公開され、優劣が見え始めました。

ひと目でわかる

会話の蓄積 → メモリの抽出・保存 → 関連メモリの検索 → プロンプトへの注入 → パーソナライズされた応答

なぜ独立したカテゴリになったのか?

以前は「RAGイコールメモリ」でした。会話ログをベクターDBに入れておいて、類似度検索で取り出せば十分だと。ところがLOCOMOベンチマークがこの前提を覆しました。mem0が4月1日に公開した結果によると、単純なRAGは精度61%にとどまり、ChatGPT Memoryはさらに低い52.9%でした。一方、Mem0は66.9%、グラフメモリと組み合わせたMem0gは68.4%まで引き上げました。コンテキスト全体をLLMに渡すFull-context方式が72.9%で最高でしたが、応答に9.87秒かかりました。Mem0gは1.09秒です。

メモリは「精度 vs レイテンシ」のトレードオフ問題として定着し、これを解決しようとする企業が独立したインフラとして分離されました。

ツールの中にメモリを埋め込んでしまうと、2つのことができなくなります。1つ目は、複数のエージェントが同じユーザー情報を共有できないこと。ChatGPTで話した内容がClaudeに引き継がれません。2つ目は、会話以外のデータ（メール、ドキュメント、CRM）と統合した記憶を作れないこと。どちらもツール依存から来る限界です。そこでメモリを切り出して、どのLLMでもどのエージェントでも接続できるようにしたのが、mem0・Letta・Zepのような新しいカテゴリです。

エピソード記憶（Episodic memory）
先週火曜日にユーザーが「Cursor 3を調べて」と言った出来事の記録。時系列が重要。
意味記憶（Semantic memory）
「このユーザーはフルスタック開発者で、Next.jsを好む」という一般的な事実。時間に依存しない。
手続き記憶（Procedural memory）
「新しいプロジェクトを始めるときは必ず.envから作る」という行動パターン。学習された手順。

この3つを1つのシステムで同時に扱うことが、2026年のメモリインフラの標準要件です。

3者はなぜ異なる道を選んだのか?

mem0・Letta・OpenAI Memoryは同じ問題を解くとしながら、出した答えは正反対です。まとめるとこうなります。

基準	Mem0	Letta	OpenAI Memory
アプローチ	Bolt-onライブラリ	フルスタックエージェントランタイム	ChatGPT内蔵機能
ロックインコスト	低い（数日で交換可能）	高い（2〜6週間）	非常に高い（ChatGPT依存）
スコープ	user_id / agent_id / run_id / app_id の4段階	core / recall / archival の3段階	グローバル単一スコープ
ベンチマーク精度	66.9%（Mem0g 68.4%）	500回以上のインタラクションを維持	52.9%
料金	無料月1,000件、Pro 月$249	オープンソース + クラウド	ChatGPT Plus 月$20に含む
適したケース	複数のLLMを切り替えるマルチエージェント	長期運用する自律エージェント	個人ChatGPTユーザー

Mem0は「メモリはライブラリだ」という路線です。OpenAIでもAnthropicでもGeminiでも、切り替えながら同じメモリレイヤーを使えます。21のフレームワークと19のベクターストアバックエンドをサポートしています。核心的な価値はポータビリティ。モデルが変わっても、ユーザーの記憶はついてきます。

Lettaは「メモリはOSだ」という路線です。MemGPT論文から生まれたこの会社は、メモリをコア/リコール/アーカイブの3段階に分けて、OSのように管理します。エージェントが自分のメモリを直接編集・圧縮・昇格させる自律性を持ちます。ただしロックインが大きいです。一度Lettaに乗ると、別のシステムへの移行に2〜6週間かかります。

OpenAI Memoryは「メモリはChatGPTの機能のひとつ」にとどまりました。だからLOCOMOで52.9%と最下位なんです。

Lettaが追跡した別のベンチマークでは、Lettaが500回以上のインタラクションを経ても一貫性を維持した一方、通常のRAGは50回を超えると記憶が断片化しました。長期運用が必要ならLetta、マルチモデル/マルチエージェントならmem0が優位と考えて大丈夫です。

注意 — OpenAI Memoryだけを使うべきでない理由
ChatGPT内で完結するなら十分です。ただし、サイドプロジェクトでエージェントを作ったり、Claude CodeやCursorでも同じユーザーコンテキストを使いたい場合、OpenAI Memoryはクローズドなシステムなので限界が明確です。外部APIがありません。

どれをどう選べばいいのか?

実践的な判断基準を3つに絞りました。この流れに沿って考えると、意思決定がスムーズになります。

「複数のLLMを切り替える可能性があるか?」
Yes → Mem0。No → 次の質問へ。
「エージェントが自律的に数日〜数週間単位で運用されるか?」
Yes → Letta。No → 次の質問へ。
「ChatGPT内で完結するか?」
Yes → OpenAI Memory。No → Mem0に戻ってスタート。

実際の導入事例を見ると、Mem0は無料ティアで月1,000件のメモリを許容しているので、サイドプロジェクトで始めやすいです。本格的なワークロードはPro 月$249からで、このときグラフメモリ（Mem0g）が有効になって精度が1.5ポイント上がります。 Lettaはオープンソースコアがフリーでセルフホストでき、マネージドクラウドは従量課金です。初期費用はほぼゼロです。

もうひとつ注目したいのがOpenMemory MCPです。mem0が作ったローカルファースト版で、記憶をユーザーのデバイスだけに保存し、MCPプロトコルですべてのエージェントがアクセスできます。プライバシーが重要な作業なら、クラウドメモリの代わりにこちらを選ぶのが正解です。

さらに深掘りしたい人へ

Mem0公式LOCOMOベンチマーク — 4月1日公開 Mem0g 68.4% / 1.09秒 vs OpenAI Memory 52.9%。精度とレイテンシを同時に測定した初の公開比較 mem0.ai

Mem0 vs Letta vs MemGPT ロックイン分析 システム移行に数日 vs 2〜6週間かかる理由。ライブラリ/ランタイム/研究OSSの構造的な違い tokenmix.ai

2026年 AIエージェントメモリツール8選 Mem0/Zep/Pinecone/Letta/LangMem/Weaviate/Neo4j/Redis の料金と適合ワークロード techsy.io

Mem0 ECAI 2025論文 arXiv:2504.19413。RAG比26%の精度向上、91%のレイテンシ短縮の根拠 arxiv.org

よくある質問

既存のRAGでメモリを代替することはできませんか?

難しいです。LOCOMOベンチマークでRAGの精度は61%と、グラフメモリベースのMem0g（68.4%）より7ポイント低い結果でした。単純な類似度検索では時系列のイベントやユーザーの好みの変化を追跡できないため、50回を超えると記憶が断片化していきます。

mem0とLettaのどちらか一方を選ぶとしたら?

エージェントが数日以上自律運用されるならLetta。複数のLLMを切り替えたい、またはサイドプロジェクトで素早くスタートするならmem0です。ロックインコストの差が大きく、mem0は数日で別のシステムに移行できますが、Lettaは2〜6週間かかります。

個人用途ならOpenAI Memoryだけで十分ですか?

ChatGPT内だけで作業するなら十分です。ただし、Claude CodeやCursor、自前のエージェントなど他のツールでも同じユーザーコンテキストを引き継ぎたい場合、OpenAI Memoryは外部APIがないため限界があります。マルチツール環境ならmem0をおすすめします。

プライバシーの懸念でメモリをクラウドに上げたくありません。

OpenMemory MCPを使ってください。mem0が作ったローカルファースト版で、記憶をユーザーのデバイスだけに保存し、MCPプロトコルでどのエージェントでもアクセスできます。外部サーバーにデータが送信されません。

グラフメモリ（Mem0g）は通常のメモリより常に優れていますか?

精度は1.5ポイント程度高いですが、レイテンシがわずかに増え、コストも上がります。ユーザーの関係性や時系列のイベントが重要なドメイン（カスタマーサポート、ヘルスケアなど）ではグラフが有利です。単純な好みの記録なら通常のメモリで十分です。

著者ラッシュ

ビジネスとAIが交わる接点を追跡します。

このリファレンスは役に立ちましたか？

毎週厳選されたリファレンスをメールでお届けします

このリファレンスを共有

ラルフトン — 人間が退勤し、AIが夜通しコーディングするハッカソン

ソウルで開催された韓国初のAIエージェントハッカソン。キーボードに触れずに10万行のコードを書いた優勝チームの話と、ハーネスエンジニアリング時代が幕を開ける現場レポート。

こんなリファレンスもあります

他の読者も読んだリファレンス

26人がOpenAIに挑んだ — ArceeのオープンソースLLMがOpenClawで1位になるまで

techcrunch.com

Arcee AI、Trinity LLM、オープンソースAI、OpenClaw代替、小規模スタートアップ

26人がOpenAIに挑んだ — ArceeのオープンソースLLMがOpenClawで1位になるまで

わずか26人のスタートアップArceeが2000万ドルで400Bのオープンソース大規模言語モデルを開発し、OpenClawで最も使われるオープンモデルの第1位に。小規模チームの戦略と開発者が注目する理由をまとめました。

詳しく見る

OpenAIがmacOS仮想化チームを丸ごと連れ去った — Cirrus Labs買収とエージェントインフラの次の一手

cdn.prod.website-files.com

Cirrus Labs, OpenAI, Agent Infrastructure, Tart, Apple Silicon仮想化, Codex

OpenAIがmacOS仮想化チームを丸ごと連れ去った — Cirrus Labs買収とエージェントインフラの次の一手

OpenAIがApple Silicon仮想化ツールの代名詞Cirrus Labsを買収しました。TartやVetuなどのVM仮想化技術をAgent Infrastructureチームに取り込み、AIエージェントが自律的にコードをビルド・テストできる隔離実行環境を構築する狙いです。

詳しく見る

次へ →ラルフトン — 人間が退勤し、AIが夜通しコーディングするハッカソン