大企业的AI采用现状,你通常从哪里获取信息?多数是基于问卷的报告。"贵公司在用AI吗?" — "在用。"这种数据看不出实质。a16z这次做了不一样的事:他们直接汇总了财富500强(Fortune 500)和Global 2000企业的真实AI合同与营收数据。

核心数据
财富500强中29%是AI初创付费客户 编程是压倒性第一场景 客服、搜索分列二三位 科技、法律、医疗为领跑行业 模型性能4个月提升20个百分点

这是什么?

这是a16z投资合伙人Kimberly Tan在2026年4月发布的报告。它与现有的企业AI研究有一个关键区别。

传统研究:"贵公司是否使用AI?"这类自我报告(self-reported)问卷,衡量的是定性的态度(sentiment)。
a16z报告:汇总了AI初创公司的真实合同数据、公开营收信息,以及从数千场企业与初创公司会议中收集到的数据。

所以结论也不太一样。MIT说"AI试点95%都失败",而a16z的数据指向了相反方向。

29%
财富500强中,已是AI初创公司付费客户
~19%
Global 2000中,已是AI初创公司付费客户
3年
从ChatGPT发布到达成上述数字所用的时间
370亿美元
2025年企业生成式AI支出(Menlo Ventures)

这数字有多反常,加点背景就懂了。财富500强企业并不是新技术的早期采用者。通常初创公司先卖给其他初创公司,几年后才能拿下大企业的第一份合同。但AI颠覆了这个惯例。仅仅3年,财富500强中近三分之一已经成为AI初创公司的付费客户。

其他数据也指向同一方向。根据Menlo Ventures的数据,企业生成式AI支出从2024年的115亿美元增长到2025年的370亿美元,增长3.2倍;NVIDIA的调查显示,64%的企业已将AI用于实际运营。

有什么不同?

钱集中流向的地方,清晰地分为三块。

使用场景:编程 > 客服 > 搜索

使用场景 特征 为什么能跑通
编程 规模超过其他所有场景之和 数据丰富、可验证、工程师是早期采用者、生产力提升10~20倍
客服 基于SOP,可量化衡量 意图收敛、可升级处理、替代BPO使变更管理成本低
搜索 企业内部搜索 + 行业垂直搜索 ChatGPT本身就是搜索工具,Glean、Harvey、OpenEvidence高速增长

编程之所以一骑绝尘,a16z是这样解释的:代码数据丰富(网上有大量高质量代码)、基于文本易于模型解析、语法精确可立即验证结果。Cursor的爆发式增长、Claude Code和Codex的迅猛崛起就是证明。

而且编程工具不需要100%完美也有价值。生成样板代码(boilerplate)、查找bug这种部分自动化就足以节省时间。开发者复核的human-in-the-loop工作流自然成立,企业采用门槛很低。

客服位居第二的原因很有意思

客服与编程恰好相反。编程是投资最密集的领域,而客服是最被忽视的领域。但它对AI来说非常合适。意图收敛("我要退款")、SOP明确、CSAT和解决率等指标可以立刻证明ROI。再加上本来就外包给BPO,换成AI变更管理成本也低。还有"为您转接经理"这种自然的升级路径,试点风险最小。

行业:科技(意料之中),法律和医疗(意料之外)

科技行业领跑很自然。ChatGPT商业用户中27%来自科技业。有意思的是法律和医疗

法律本来是软件采用最慢的市场。导入周期长,技术友好型买家少。但传统软件对律师价值有限,而AI直接切入核心业务(海量文本分析、推理、摘要、起草)。Harvey创立3年就达成2亿美元ARR就是证据。

医疗也有类似模式。EHR(电子健康记录)系统垄断了市场,新软件很难插入,但AI找到了不替代EHR又能带来明确价值的缝隙——病历记录(scribing)、医学搜索、后台自动化。Abridge、Ambience Healthcare等公司正快速成长。

尚未爆发但模型能力在快速提升的领域

a16z最关注的就是这一块。以OpenAI的GDPval基准来看,模型性能正在爆发式改善。

01
会计与审计 — 4个月内GDPval分数上升约20个百分点。目前还没有大型独立AI初创公司,是一片蓝海。
02
调查与侦查类工作 — 4个月改善约30个百分点。在非结构化数据分析方面AI能力急速提升。
03
电子表格与财务工作流 — Anthropic正在开发金融服务专用Claude。在遗留系统之上利用computer use。
04
长跨度(long-horizon)任务 — METR基准显示Agent的自主作业时长在快速延长,超越简单任务的复杂业务自动化正在成为可能。

其他调查也描绘了类似图景。McKinsey指出几乎所有企业都在使用AI,但三分之二尚未进入规模化阶段;Deloitte预计在6个月内,40%以上项目进入生产环境的企业比例将翻倍;ISG透露2025年达到生产环境的用例同比翻倍,达到31%。

总结来说,AI采用确实在发生,且在加速。但关键是它并非均匀铺开,而是集中在特定的使用场景与行业。

上手指南

综合a16z报告及多份调查,为正在评估大企业AI采用的人整理了一套框架。

  1. 从"可验证的领域"入手
    AI运行得最好的领域有共同点:基于文本、重复性工作、human-in-the-loop自然成立、结果可验证。编程、客服、搜索之所以稳坐前三,原因都在这里。先在自己组织里找出符合这些条件的业务。
  2. 先从客服试起 — 试点风险最低
    有现成的SOP,可以用CSAT、解决率立刻衡量ROI,失败了升级给人工就行。编程工具开发团队会自己采用,但客服需要管理层决策,而且ROI更容易证明。
  3. 持续追踪模型性能趋势
    现在AI做不到的事,6个月后可能就变了。就像会计审计领域4个月提升20个百分点的案例。定期关注GDPval、METR这类基准,就能把握"AI何时在我们领域变得可用"的时机。
  4. 不要低估"部分自动化"的价值
    AI即便只自动化了50%的工作,也能让你专注于另外的50%。就像编程工具只生成样板代码,开发者生产力却能提升10~20倍。把目标定在100%自动化会失败,但部分自动化是已被验证的策略。
  5. 如果是建造者(builder) — 瞄准模型已经够好但还没有初创公司的领域
    这是a16z给建造者的核心建议。当前营收动能也许还没出来,但以GDPval为标准模型能力正在急速上升的领域。当前成功的AI初创公司中,很多也是在模型变得足够强之前,先建立基础设施和客户关系而抢占先机的。

记住问卷数据与真实营收数据的差异

McKinsey、Deloitte、NVIDIA的调查基于问卷,"在用AI"的定义比较宽松。a16z的报告基于真实合同与营收,所以更保守。把两类数据结合起来看,才能看清整体图景。