视觉AI工具遍地都是,但在实际生产流程中用起来总有点别扭——像素输出一旦生成,就很难再修改了。

a16z合伙人Yoko Li把这个问题说得很准:「今天最有趣的视觉AI工具,已经不再尝试直接生成最终输出物,而是在生成输出物背后的源代码。」

30秒速览
像素AI的局限 代码原生崛起 SVG · HTML · Lottie JSON 可编辑 · 可迭代 生产工作流重塑

大家说"视觉AI",脑子里想的都是Midjourney

Midjourney、DALL-E、Stable Diffusion——这些都是「像素原生」的工具,接收文本提示直接输出成品图片。

像素生成确实有它的强项:纹理、氛围、光线、真实感。用来做营销视觉或概念图,现在依然够用。但问题出在生成之后。

像素原生AI代码原生AI
输出格式PNG、JPEG图像SVG、HTML/CSS、Lottie JSON
修改方式重新生成或Photoshop手动处理在Illustrator或代码编辑器中直接编辑
AI迭代AI看不到自己的输出(闭眼重生成)Code → Render → Inspect → Revise循环
约束验证不可能——像素没有约束自动验证颜色、尺寸、组件复用
生产集成图像文件手动传递组件复用、CI/CD自动化

a16z为什么押注代码生成AI

2026年,a16z领投了Quiver AI的830万美元种子轮。 Quiver AI做的不是图像生成AI,而是接收文本提示或光栅图像,直接输出SVG代码的AI模型。

为什么这种方式更强?Yoko Li给出了三个理由。

  1. 可以迭代
    代码原生系统支持「Code → Render → Inspect → Revise」闭环。像素AI没有反馈机制——模型看不到自己的输出。代码让AI可以检查并调试自己生成的内容。Li将其称为「模型在可渲染的闭环环境中调试视觉程序」。
  2. 可以验证
    代码支持约束条件。色彩规范合规性、尺寸要求、组件复用——这些用像素完全无法验证,但SVG和HTML/CSS是代码,可以自动检查。
  3. 精度不同
    3D资产是好例子。「一个3D资产如果只从一个角度看起来对,它就没用。」你需要一致的几何结构、材质和层级关系——这些只能用Blender脚本或USD场景图来表达。

市场正在围绕运行时(runtime)重组:浏览器(HTML/CSS)、矢量渲染器(SVG)、动画播放器(Lottie)、3D引擎(Blender、USD)。每个运行时都在催生专属的AI工具。

哪些工具已经在这么做了?

$8.3M
Quiver AI a16z种子融资
33%↓
Arrow 1.1文本转SVG成本下降
50%↓
矢量化成本下降

Quiver AI — SVG生成:接收文本提示或光栅图像,生成可编辑的SVG Logo、图标和插图。Arrow 1.1模型让文本转SVG成本降低33.3%,图像矢量化成本降低50%。[[cite:3][cite:4]] 还提供MCP服务器,让Cursor或Claude这类Agent环境可以直接把SVG文件生成并插入项目。

Paper — HTML/CSS画布:定位「为Agent时代打造的协作画布」。外观像Figma,但底层是HTML/CSS——「设计导出即是代码,翻译中不会丢失任何东西。」 Claude、Cursor、GitHub Copilot等AI Agent可以通过MCP直接访问设计画布进行操作。

其他值得关注的工具

动画领域:OmniLottie将Lottie JSON转化为AI可直接生成的命令序列。3D领域:VIGA使用Blender反馈循环生成3D资产,Articraft3D则将关节3D生成视为语义程序编写。

现在就能上手的方法

  1. 创建Quiver AI账户
    访问quiver.ai免费注册。在网页端(app.quiver.ai)用文本提示生成一个Logo或图标,和像素AI的差别马上就能感受到。
  2. 编辑SVG输出
    把生成的SVG拖进Illustrator或Figma。和像素图像不同,图层结构完整保留。颜色、尺寸、形状都可以自由调整。
  3. 接入Cursor MCP(开发者适用)
    在Cursor Settings → MCP中添加端点 https://app.quiver.ai/mcp。之后就可以对Agent说:「给这个项目生成3个SVG图标,放到/src/assets里。」
  4. 用Paper体验Agent驱动设计
    安装Paper桌面端并接入MCP后,Claude或Cursor可以直接在HTML/CSS画布上进行设计操作——最接近「Agent时代的设计工具」的体验。[[cite:5][cite:6]]

像素AI不会消失

Midjourney或DALL-E在氛围、纹理方面的表现,代码原生工具很难替代。目前最实用的做法是:用像素AI做氛围参考,用代码原生AI生成可编辑的生产资产,两种方式配合使用。