"帮我做一个网站"——靠这一句话就能得到真正能用的网站,这样的时代已经来了。不过说实话,AI做出来的网站大多数还是"Bootstrap默认主题"那种感觉,对吧?OpenAI这次正面承认了这个问题,把用GPT-5.4打造"精致"网站的具体做法全部公开在官方博客上

3秒速览
定义设计系统 设置Hard Rules提示词 安装frontend-skill 用Playwright自动验证 完成精致网站

这是什么?

OpenAI开发者博客上这篇《Designing Delightful Frontends with GPT-5.4》可不是简单的介绍文。 它完整收录了从提示词层面到验证方法——给AI设定哪些规则能让设计质量大幅提升——的实战指南。

先了解背景会更好理解。GPT-5.4是OpenAI于2026年3月发布的最新前沿模型,其中最大的亮点是它是首个能直接操作电脑的主力模型。 它能读取屏幕、点击鼠标、敲键盘。所以当它和Playwright这类浏览器自动化工具结合之后——AI写代码、在浏览器里直接确认、发现问题自己修复——这样的闭环就成立了。

这份指南的核心分为三部分:

  1. Hard Rules提示词
    显式地设定AI必须遵守的设计规则。"别用卡片"、"Hero区域要做成全宽(full bleed)"、"每个section只承担一个目的"——都是这种具体的约束条件。
  2. 构建前的3份文档
    在开始编码前,先让AI写出:视觉论点(Visual Thesis,也就是氛围、材质、能量感)、内容规划(Hero→CTA的流程)、交互论点(Interaction Thesis,2~3个动效)。
  3. Playwright视觉验证
    让AI直接在浏览器中打开它生成的页面进行确认,自动修复响应式错位或交互bug。

推理等级要调低

OpenAI的官方建议:前端任务用low~medium级别的推理,结果反而更强。 高推理会让模型"想太多",结果就是加入多余元素,或把布局搞得过于复杂。关键在于——前端工作更考验品味,不是考验推理深度。

有什么不同?

"帮我做得漂亮点"和设置了Hard Rules之后,产出完全不是一个档次。这是OpenAI内部测试中确认的差异。

只用提示词(无规则) Hard Rules + frontend-skill
Hero区域 内嵌图片 + 罗列一堆卡片 全宽Hero,品牌优先呈现
布局 仪表盘式卡片网格 基于section,尽量少用卡片
字体排印 Inter/Roboto默认值 贴合语境的表现性字体
移动端适配 经常出现错位 Playwright按视口自动验证
动效 要么没有要么过度 2~3个有意图的动效(Framer Motion)
文案 Lorem ipsum或老套话 反映真实产品语境

GPT-5.4的基准测试成绩也很亮眼。桌面操作(OSWorld)得分75%,超过了人类(72.4%);网页浏览器使用(WebArena)也达到了67.3%。 在实际演示里,只给它一张设计图、说"按这个风格做一个咖啡店网站",它一次就做出了响应式都完美的站点。

最大的变化在于AI终于能"亲眼看见"自己的作品了。 以前AI只会吐代码,实际渲染结果得人类去看。现在用GPT-5.4 + Playwright组合,模型能自己打开页面,在多个视口测试,连状态管理和导航问题都能察觉到。

75%
OSWorld桌面操作(人类72.4%)
2/3
相比前代模型Token用量削减
92.8%
截图理解度(Mind2Web)

上手指南

这里只抽取OpenAI指南中的实战要点。照做就能立刻感受到差异。

  1. 设置Hard Rules提示词
    把下列规则放进系统提示词或项目配置文件。核心要点:第一屏只保留一个构图(不是仪表盘)、品牌名是最大的文字、Hero做成全宽、卡片只在需要交互的场景用、每个section只承担一个目的。
  2. 先写构建前的3份文档
    开始写代码前,让AI先写三样东西:(1)视觉论点——用一句话概括氛围、材质、能量感;(2)内容规划——按Hero→支撑→细节→CTA的顺序排布;(3)交互论点——提出2~3个动效创意。
  3. 技术栈选React + Tailwind
    这是OpenAI官方推荐的组合。 据说GPT-5.4在这个栈上能发挥最大实力。shadcn/ui、Framer Motion也很搭。
  4. 附上参考图
    比起"做得漂亮点"这句话,一张截图的作用大10倍。 附上情绪板或已有设计的截图,GPT-5.4能连布局节奏、字号层级、间距都推理着对上。
  5. 用Playwright做自动验证(可选,但强烈推荐)
    在Codex里安装`frontend-skill`,Playwright会自动挂上。AI会亲自打开它做的页面,在桌面/移动视口下验证,再修复问题。

常见错误:文案不要敷衍

OpenAI指南反复强调的一点。不要用"Lorem ipsum"这种占位文本,要用真实的产品名、真实的文案、真实的语境。 文案质量直接决定设计结果。"如果删掉30%的文案页面反而变好,那就继续删"——这是官方建议原话。