Loading...

Adaption AutoScientist AI 자동 파인튜닝 플랫폼

adaptionlabs.ai

AI开始训练AI了 — AutoScientist如何超越人类研究员35%

AI自动微调, AutoScientist, AI模型训练自动化, Adaption, Sara Hooker开发

Adaption aims big with AutoScientist, an AI tool that helps models train themselves

AutoScientist: Automate the Science of Model Training

Adaption's AutoScientist Automates Model Fine-Tuning With Closed-Loop Training Outperforming Human-Designed Configurations

AI研究员花几周时间调整的模型训练，AutoScientist几小时就搞定了。而且比人类专家设计的配置好了35%。

3秒速览

定义目标 → 运行AutoScientist → 数据+配方同时优化 → 迭代收敛 → 定制AI模型完成

这是怎么做到的？

微调（fine-tuning）就是把GPT这样的通用模型重新训练，让它专注于"法律文档分析"或"客服"这类特定用途。

问题是这件事极其复杂——用哪些数据、丢掉哪些、学习率设多少、跑几个epoch、损失函数怎么配。这些组合的可能性数不清。所以真正意义上的微调，一直是AI研究所级别专家才能做的事。

Adaption的AutoScientist把整个流程交给AI来做。它同时优化数据选择和训练配方，自己找出哪种组合最终会收敛到目标。

35%

超越人类研究员设计的性能提升

48%→64%

对比专家配置的胜率提升

数周→数小时

模型训练周期缩短

CEO Sara Hooker曾任Cohere AI研究副总裁，在Google DeepMind工作了五年。 2026年2月，Adaption获得了Emergence Capital、Mozilla Ventures和Fifty Years的5000万美元种子投资。这不是普通的套壳创业公司——是最懂AI训练的团队做出来的产品。

微调为什么一直这么难

传统微调有三大经典失败模式：(1) 灾难性遗忘——学新东西就忘旧本领。(2) 过拟合——训练数据完美，真实环境崩溃。(3) 信号冲突——相互矛盾的训练数据让模型混乱。AutoScientist专门设计来自动检测并规避这三种情况。

数字到底说明了什么？

Adaption公布的内部基准：AutoScientist对阵自家AI研究员设计的训练配置，跨8个领域、5K到100K样本量、Together AI的100B+参数模型架构，平均性能提升35%，胜率从48%升至64%。

	传统微调	AutoScientist
优化对象	数据或训练配方（分开）	数据+配方同时优化
耗时	数周（手动反复实验）	数小时（自动收敛）
所需专业度	资深ML工程师必备	无需深厚ML知识
数据处理	全量使用（含噪音）	自动筛选高价值数据，过滤有害噪音

核心主张很有力："大型实验室之外也能进行前沿级别的模型训练。"

核心整理：怎么开始

定义目标
明确你需要什么任务的专属模型——越具体越好。
准备数据
5,000条以上的样本就能开始。不需要完美清洗，AutoScientist会自动识别高质量数据。
运行AutoScientist
在adaptionlabs.ai申请30天免费试用，输入目标，让它跑起来。
观察收敛过程
AI自动尝试各种组合，向目标收敛——相当于研究员手动跑几百次实验。
部署模型
基于Together AI，支持100B+参数模型，可直接上云服务。

🔗

더 깊이 파고 싶다면

AutoScientist官方博客

Adaption直接说明AutoScientist的工作原理和主要性能指标。

Adaption aims big with AutoScientist (TechCrunch)

Sara Hooker访谈原文，AutoScientist的诞生背景与产业愿景。

Sara Hooker Bets $50M That Smarter Training Beats Bigger Models

5000万美元融资背景和AI训练专业积累的详细分析。

AutoScientist Automates Model Fine-Tuning

闭环训练机制的技术细节和内部基准测试深度解析。

常见问题

和OpenAI Fine-tuning API这类工具有什么区别？

OpenAI的微调API是给数据它来训练。AutoScientist是自己找出用哪些数据、怎么训练——同时优化数据选择和训练配方。这是"给我数据，帮我做点什么"和"给我目标，其余的我来搞定"的本质区别。

35%性能提升的说法可信吗？

目前还没有外部独立验证，这是和Adaption自己的研究员设计进行比较的内部基准测试结果。30天免费试用期间用自己的数据亲自测试，是最直接的验证方式。

需要多少数据才能开始？

测试范围是5,000到100,000个样本。数据不需要完美清洗——AutoScientist会自动识别高价值信号数据并过滤有害噪音。从5,000个领域专属样本开始就可以了。

最适合什么用途？

适合特定领域任务，而非通用基准测试。医疗记录处理、法律文档分类、领域专属代码生成、客服自动化——"用自有数据打造专属模型"的场景正是它的主场。

30天后怎么收费？

目前没有公开定价，是企业销售模式，试用期后与销售团队协商。考虑到支持100B+参数模型的Together AI基础设施，大概率是按使用量计费。

作者拉什

追踪商业与AI的交汇点。

这个参考对您有帮助吗？

每周精选参考直达您的邮箱

分享此参考

8年只想不动手的产品,我用AI编程代理3个月做完了

8年只想不动手的产品,我用AI编程代理3个月做完了

Google资深工程师把搁置8年的开源项目,用AI编程代理3个月内做出来了。从Vibe Coding的失败、推倒重写,到AI真正擅长与不擅长的事——一份用250小时实战记录证明的复盘。

你可能还感兴趣

其他读者也在看的参考

Cursor 估值冲击 500 亿美元 — 6 个月翻倍,AI 编程工具市场全面爆发

Cursor爆发式增长至500亿美元估值，预示AI编程工具市场大变局

Cursor 估值冲击 500 亿美元 — 6 个月翻倍,AI 编程工具市场全面爆发

ARR 突破 20 亿美元,3 个月营收翻倍。并行 Agent、MCP Apps、JetBrains 集成——Cursor 揭示 AI 编程市场的真实规模与未来走向。

只需教AI一次 — Claude Skills 33页指南完整整理

cdn.infograb.io

只需教AI一次 — Claude Skills 33页指南完整整理

Anthropic公开的33页官方指南核心总结。用一个文件夹向Claude传授业务诀窍的Skills功能——节省50%token，消息15次→2次，还可以全团队共享。

下一篇 →8年只想不动手的产品,我用AI编程代理3个月做完了