Santiago Valdarrama 用 Claude Code 做了一件事 — 「从 5 个网站一次性抓 50 套两居室房源,直接拿到整理好的表格。」 一行代码都没写。
关键在于一种新格式,叫 Skill。往 Claude Code 里塞一份 markdown 文件,「从网页抓取实时数据」就成了它的自动能力。2026 年春季,Claude、ChatGPT、Gemini 同时采用了这个模式,但真正的价值,其实在用作编码工具时才显现。
这是什么?
Claude Code Skill 就是一份文件,由 YAML 前置元数据(frontmatter)+ markdown 正文组成。位置固定在 ~/.claude/skills/{名称}/SKILL.md。Claude 听到用户请求后,会根据 description 字段自动判断该用哪个 Skill。 你不用敲「/web-scrape」之类的命令 — 它靠上下文触发。
Santiago 的 LinkedIn 帖子之所以爆火,理由很简单。「You can use Claude Code to pull live, structured data from any website... organized in tables you can work with immediately. Not a wall of text.」 他举的例子 — 指定区域的两居室、48 小时内挂出的、提取价格和面积、跨平台规范化。这一切用一句自然语言就能搞定。
这正是它和 Cursor、Windsurf 这类基于 IDE 的工具的关键差异。Skill 是工具调用的抽象单元。SKILL.md 写一次,这个能力就在所有项目里自动可用 — 你不用每次都把同样的指令复制粘贴到 prompt 里。
- SKILL.md 结构
YAML 前置元数据(name、description、allowed-tools)+ markdown 正文(写清工作流程)。 - description 字段是核心
Claude 就靠这一句话决定要不要触发。需要写得具体,比如「Use when user asks for live web data extraction」。 - 明示工具
把 Firecrawl、Nimble、Zyte 这类外部 API 写进 allowed-tools。认证密钥放环境变量。 - 指定输出格式
在正文里钉死「永远以 markdown 表格返回」这类确定性指令。
跟 Cursor 干的事有什么不同?
| 对比项 | Cursor / 一般 IDE | Claude Code Skill |
|---|---|---|
| 能力的持久性 | 每个项目都要重写 prompt | SKILL.md 写一次,所有地方都能用 |
| 触发方式 | 斜杠命令、显式调用 | 上下文自动匹配 |
| 输出 | Markdown 文本 | 结构化数据(JSON、CSV、表格) |
| 外部 API 接入 | 每次调用都要塞密钥 | SKILL.md 里指定一次 |
| 分享 | 绑死在代码库里 | 一份文件就能分发给团队 |
Zyte 也用同样的语法发布了 Claude Skill — HTML fetching → AI parsing → selector generation → structured extraction,四个步骤打包进一个 Skill。 Firecrawl 在官方博客上发了 SKILL 编写教程。 Nimble 则被 Santiago 评为「10/10」工具。
关键在于,这不是「抓取自动化」,而是「能力的封装」。同样的模式 — 数据库查询、PDF 解析、API 集成、会议纪要整理 — 任何重复性工作都能抽成一份 SKILL.md。
上手指南
- 确认 Claude Code 最新版本
Skill 需要 Claude Code 1.0+。用claude --version查看。 - 建 Skill 目录
mkdir -p ~/.claude/skills/web-scraper。名称用 kebab-case。 - 写 SKILL.md
YAML frontmatter 写清 name、description、allowed-tools(curl、Firecrawl 等)。正文写工作流程步骤。 - 注册外部工具
把 Firecrawl、Nimble 这类 API 密钥写进.env,在 SKILL.md 里引用。推荐用FIRECRAWL_API_KEY这种环境变量名。 - 用自然语言调用
「Get all 2-bedroom apartments posted in last 48h in [区域]」这样一句话。Claude 会自动触发对应 Skill。
常见问题
(由 FAQSection 自动渲染 — 不放进 content)
深入了解
Firecrawl — Claude Code Skill 编写教程 从 SKILL.md 结构到多功能 Skill 的完整指南 firecrawl.dev
Santiago(@svpino)— LinkedIn 原帖 「10/10 for agents needing web data」— 房源案例的一手出处 linkedin.com/svpino
Zyte — 用 Claude Skills 加速网页抓取 HTML→AI parsing→selector→数据提取的四步 Skill 模式 zyte.com
yfe404/web-scraper 内嵌 6 道质量关卡的开源抓取 Skill — 优先用 curl,必要时才上浏览器 github.com/yfe404/web-scraper




