Santiago Valdarrama 用 Claude Code 做了一件事 — 「从 5 个网站一次性抓 50 套两居室房源,直接拿到整理好的表格。」 一行代码都没写。

关键在于一种新格式,叫 Skill。往 Claude Code 里塞一份 markdown 文件,「从网页抓取实时数据」就成了它的自动能力。2026 年春季,Claude、ChatGPT、Gemini 同时采用了这个模式,但真正的价值,其实在用作编码工具时才显现。

这是什么?

Claude Code Skill 就是一份文件,由 YAML 前置元数据(frontmatter)+ markdown 正文组成。位置固定在 ~/.claude/skills/{名称}/SKILL.md。Claude 听到用户请求后,会根据 description 字段自动判断该用哪个 Skill。 你不用敲「/web-scrape」之类的命令 — 它靠上下文触发。

Santiago 的 LinkedIn 帖子之所以爆火,理由很简单。「You can use Claude Code to pull live, structured data from any website... organized in tables you can work with immediately. Not a wall of text.」 他举的例子 — 指定区域的两居室、48 小时内挂出的、提取价格和面积、跨平台规范化。这一切用一句自然语言就能搞定。

这正是它和 Cursor、Windsurf 这类基于 IDE 的工具的关键差异。Skill 是工具调用的抽象单元。SKILL.md 写一次,这个能力就在所有项目里自动可用 — 你不用每次都把同样的指令复制粘贴到 prompt 里。

  1. SKILL.md 结构
    YAML 前置元数据(name、description、allowed-tools)+ markdown 正文(写清工作流程)。
  2. description 字段是核心
    Claude 就靠这一句话决定要不要触发。需要写得具体,比如「Use when user asks for live web data extraction」。
  3. 明示工具
    把 Firecrawl、Nimble、Zyte 这类外部 API 写进 allowed-tools。认证密钥放环境变量。
  4. 指定输出格式
    在正文里钉死「永远以 markdown 表格返回」这类确定性指令。

跟 Cursor 干的事有什么不同?

对比项 Cursor / 一般 IDE Claude Code Skill
能力的持久性 每个项目都要重写 prompt SKILL.md 写一次,所有地方都能用
触发方式 斜杠命令、显式调用 上下文自动匹配
输出 Markdown 文本 结构化数据(JSON、CSV、表格)
外部 API 接入 每次调用都要塞密钥 SKILL.md 里指定一次
分享 绑死在代码库里 一份文件就能分发给团队

Zyte 也用同样的语法发布了 Claude Skill — HTML fetching → AI parsing → selector generation → structured extraction,四个步骤打包进一个 Skill。 Firecrawl 在官方博客上发了 SKILL 编写教程。 Nimble 则被 Santiago 评为「10/10」工具。

关键在于,这不是「抓取自动化」,而是「能力的封装」。同样的模式 — 数据库查询、PDF 解析、API 集成、会议纪要整理 — 任何重复性工作都能抽成一份 SKILL.md。

上手指南

  1. 确认 Claude Code 最新版本
    Skill 需要 Claude Code 1.0+。用 claude --version 查看。
  2. 建 Skill 目录
    mkdir -p ~/.claude/skills/web-scraper。名称用 kebab-case。
  3. 写 SKILL.md
    YAML frontmatter 写清 name、description、allowed-tools(curl、Firecrawl 等)。正文写工作流程步骤。
  4. 注册外部工具
    把 Firecrawl、Nimble 这类 API 密钥写进 .env,在 SKILL.md 里引用。推荐用 FIRECRAWL_API_KEY 这种环境变量名。
  5. 用自然语言调用
    「Get all 2-bedroom apartments posted in last 48h in [区域]」这样一句话。Claude 会自动触发对应 Skill。

常见问题

(由 FAQSection 自动渲染 — 不放进 content)

深入了解

Firecrawl — Claude Code Skill 编写教程 从 SKILL.md 结构到多功能 Skill 的完整指南 firecrawl.dev

Santiago(@svpino)— LinkedIn 原帖 「10/10 for agents needing web data」— 房源案例的一手出处 linkedin.com/svpino

Zyte — 用 Claude Skills 加速网页抓取 HTML→AI parsing→selector→数据提取的四步 Skill 模式 zyte.com

yfe404/web-scraper 内嵌 6 道质量关卡的开源抓取 Skill — 优先用 curl,必要时才上浏览器 github.com/yfe404/web-scraper