2026年Q1、米国の裁判所はAIハルシネーションによる制裁金が$145,000を超えました。ある弁護士は提出した63件の引用文書のうち57件に欠陥があり、そのうち20件は存在しない判例でした。
そして、これは弁護士だけの問題ではありません。
RAGで解決できると思ってたんですが
企業のAIハルシネーション対策のほとんどは同じです。RAGで最新データを注入するか、ドメイン知識でファインチューニングするか、システムプロンプトに「間違えないで」と書くか。
ただ、これが根本解決かというと — そうじゃないんですよ。言語モデルは構造上、確率的にしか正しくなれないんです。「次に来る言葉は何か」を統計的に予測する仕組みなので、原理的に間違える可能性があります。RAGも同様で、正しい文書を見つけてきても、解釈する段階でハルシネーションが起きることがあります。
税務申告、法律相談、新薬の薬物相互作用分析のような領域では、「95%の精度」では不十分なんです。残りの5%がミスなら、訴訟になりますから。
数学的証明は何が違うんですか?
ここでPramaana Labsが違うアプローチを取りました。IIT Madras出身の3人の共同創業者が2025年9月に設立したこのスタートアップは、数学証明言語のLEANをLLMの上に重ねる方法を選びました。
LEANは数学者が定理を証明するためのオープンソース言語です。2013年にMicrosoft Researchで開発され、複雑な数学的構造を機械が検証できる形式に変換するために使われています。ある命題が論理的に真かどうかを数学的に証明するんです。
Pramaanaのアイデアはこういうことです。税法、医薬品規制、法律条文などの複雑なドメインルールをLEANで形式化すれば、AIの出力がそのルールを数学的に違反しているかチェックできます。間違った答えは出力されない。CEO Ranjan Rajagopalan氏はこう語っています:
「世界で最も難しい問題は解けないのではありません。形式化されていないだけなんです。」
— Ranjan Rajagopalan, Pramaana Labs CEO
既存のアプローチと比較するとこうなります。
| 既存方式(RAG・ファインチューニング) | 形式検証 | |
|---|---|---|
| 仕組み | 関連文書を検索して参照 | ドメインルールをコード化して検証 |
| エラーの可能性 | 解釈段階でハルシネーション発生の可能性あり | ルール違反は数学的にブロック |
| 確実性レベル | 確率的(例:95%の精度) | 決定論的(正しいか、回答しないか) |
| 適合領域 | ほとんどの汎用業務 | 法律・税務・医療・コンプライアンス |
この発想はフランスのCATALAプロジェクトから着想を得ています。フランスの税法と社会保障制度全体を実行可能なコードに変換した国家プロジェクトです。PramaanaはそれをAIに応用したわけです。
実際どこで使われているんですか?
Pramaanaが現在注力している3つの領域です。共通点は「ルールが明文化されていて、間違えると深刻な結果を招く」ドメインであることです。
- 税務コンプライアンス
元IRS長官のDanny Werfel氏がアドバイザーを務めます。税法は数千ページに及びますが、論理的には形式化可能な領域です。AIが節税戦略を提案する際、それが実際の税法条項に違反していないか数学的に検証します。 - 法律コンプライアンス
判例法、規制条項、契約条件はすべて形式化可能なルールです。2026年初頭時点で裁判所に記録されたAIハルシネーションケースは1,353件を超えています。形式検証レイヤーがあれば、その多くが防げたはずです。 - 創薬開発
IIT Delhi、IIT Madras、UCバークレーの教授陣が監督します。臨床プロトコルとFDA規制を形式化し、AIの薬物相互作用分析が数学的に検証されたガイドライン内でのみ回答するよう制限します。
Khosla Venturesが$27Mシードラウンドを主導。Accel、BoldCap、Nexus Venture Partners、Premji Invest、Unboundが参加しました。Vinod Khosla本人も6月10日のサンフランシスコVerification Summitに直接登壇しています。
この領域が注目されている理由
Axiom Mathは数学的証明AIで2026年3月に$200MのシリーズBを調達し、企業価値は$1.6Bに。MistralはオープンソースコードをLEANで検証するLeanstralをリリース。形式検証がAIの次のインフラレイヤーとして浮上しています。
自分の業務に形式検証AIが必要かどうかを判断する方法
このチェックリストで確認してみてください。3つ以上当てはまれば、形式検証を真剣に検討する時期です。
- 法的責任の確認
業務の成果物に法的責任が伴いますか?契約書レビュー、税務申告、コンプライアンス業務がこれに該当します。 - エラーコストの試算
AIのミス1件が$10,000以上の損失や訴訟を引き起こす可能性がありますか?そうなら、確率的AIでは基盤として不十分です。 - 規則集の存在確認
業務ドメインに明文化された規則集がありますか?法令、薬典、ISOスペック、医療ガイドラインなど。形式化できるルールがあって初めて形式検証が機能します。 - 現在の検証方法の確認
AI出力が間違えた場合、どう対応していますか?「人間が再確認する」という答えなら、その人間の時間がコストです。 - ウェイトリスト登録
pramaanalabs.aiでベータ版のウェイトリストに登録してください。法律・税務・医薬品分野のエンタープライズパートナーと垂直特化ソリューションを開発中です。




