视觉AI工具遍地都是,但在实际生产流程中用起来总有点别扭——像素输出一旦生成,就很难再修改了。
a16z合伙人Yoko Li把这个问题说得很准:「今天最有趣的视觉AI工具,已经不再尝试直接生成最终输出物,而是在生成输出物背后的源代码。」
大家说"视觉AI",脑子里想的都是Midjourney
Midjourney、DALL-E、Stable Diffusion——这些都是「像素原生」的工具,接收文本提示直接输出成品图片。
像素生成确实有它的强项:纹理、氛围、光线、真实感。用来做营销视觉或概念图,现在依然够用。但问题出在生成之后。
| 像素原生AI | 代码原生AI | |
|---|---|---|
| 输出格式 | PNG、JPEG图像 | SVG、HTML/CSS、Lottie JSON |
| 修改方式 | 重新生成或Photoshop手动处理 | 在Illustrator或代码编辑器中直接编辑 |
| AI迭代 | AI看不到自己的输出(闭眼重生成) | Code → Render → Inspect → Revise循环 |
| 约束验证 | 不可能——像素没有约束 | 自动验证颜色、尺寸、组件复用 |
| 生产集成 | 图像文件手动传递 | 组件复用、CI/CD自动化 |
a16z为什么押注代码生成AI
2026年,a16z领投了Quiver AI的830万美元种子轮。 Quiver AI做的不是图像生成AI,而是接收文本提示或光栅图像,直接输出SVG代码的AI模型。
为什么这种方式更强?Yoko Li给出了三个理由。
- 可以迭代
代码原生系统支持「Code → Render → Inspect → Revise」闭环。像素AI没有反馈机制——模型看不到自己的输出。代码让AI可以检查并调试自己生成的内容。Li将其称为「模型在可渲染的闭环环境中调试视觉程序」。 - 可以验证
代码支持约束条件。色彩规范合规性、尺寸要求、组件复用——这些用像素完全无法验证,但SVG和HTML/CSS是代码,可以自动检查。 - 精度不同
3D资产是好例子。「一个3D资产如果只从一个角度看起来对,它就没用。」你需要一致的几何结构、材质和层级关系——这些只能用Blender脚本或USD场景图来表达。
市场正在围绕运行时(runtime)重组:浏览器(HTML/CSS)、矢量渲染器(SVG)、动画播放器(Lottie)、3D引擎(Blender、USD)。每个运行时都在催生专属的AI工具。
哪些工具已经在这么做了?
Quiver AI — SVG生成:接收文本提示或光栅图像,生成可编辑的SVG Logo、图标和插图。Arrow 1.1模型让文本转SVG成本降低33.3%,图像矢量化成本降低50%。[[cite:3][cite:4]] 还提供MCP服务器,让Cursor或Claude这类Agent环境可以直接把SVG文件生成并插入项目。
Paper — HTML/CSS画布:定位「为Agent时代打造的协作画布」。外观像Figma,但底层是HTML/CSS——「设计导出即是代码,翻译中不会丢失任何东西。」 Claude、Cursor、GitHub Copilot等AI Agent可以通过MCP直接访问设计画布进行操作。
其他值得关注的工具
动画领域:OmniLottie将Lottie JSON转化为AI可直接生成的命令序列。3D领域:VIGA使用Blender反馈循环生成3D资产,Articraft3D则将关节3D生成视为语义程序编写。
现在就能上手的方法
- 创建Quiver AI账户
访问quiver.ai免费注册。在网页端(app.quiver.ai)用文本提示生成一个Logo或图标,和像素AI的差别马上就能感受到。 - 编辑SVG输出
把生成的SVG拖进Illustrator或Figma。和像素图像不同,图层结构完整保留。颜色、尺寸、形状都可以自由调整。 - 接入Cursor MCP(开发者适用)
在Cursor Settings → MCP中添加端点 https://app.quiver.ai/mcp。之后就可以对Agent说:「给这个项目生成3个SVG图标,放到/src/assets里。」 - 用Paper体验Agent驱动设计
安装Paper桌面端并接入MCP后,Claude或Cursor可以直接在HTML/CSS画布上进行设计操作——最接近「Agent时代的设计工具」的体验。[[cite:5][cite:6]]
像素AI不会消失
Midjourney或DALL-E在氛围、纹理方面的表现,代码原生工具很难替代。目前最实用的做法是:用像素AI做氛围参考,用代码原生AI生成可编辑的生产资产,两种方式配合使用。




