AI研究员花几周时间调整的模型训练,AutoScientist几小时就搞定了。而且比人类专家设计的配置好了35%。
这是怎么做到的?
微调(fine-tuning)就是把GPT这样的通用模型重新训练,让它专注于"法律文档分析"或"客服"这类特定用途。
问题是这件事极其复杂——用哪些数据、丢掉哪些、学习率设多少、跑几个epoch、损失函数怎么配。这些组合的可能性数不清。所以真正意义上的微调,一直是AI研究所级别专家才能做的事。
Adaption的AutoScientist把整个流程交给AI来做。它同时优化数据选择和训练配方,自己找出哪种组合最终会收敛到目标。
CEO Sara Hooker曾任Cohere AI研究副总裁,在Google DeepMind工作了五年。 2026年2月,Adaption获得了Emergence Capital、Mozilla Ventures和Fifty Years的5000万美元种子投资。这不是普通的套壳创业公司——是最懂AI训练的团队做出来的产品。
微调为什么一直这么难
传统微调有三大经典失败模式:(1) 灾难性遗忘——学新东西就忘旧本领。(2) 过拟合——训练数据完美,真实环境崩溃。(3) 信号冲突——相互矛盾的训练数据让模型混乱。AutoScientist专门设计来自动检测并规避这三种情况。
数字到底说明了什么?
Adaption公布的内部基准:AutoScientist对阵自家AI研究员设计的训练配置,跨8个领域、5K到100K样本量、Together AI的100B+参数模型架构,平均性能提升35%,胜率从48%升至64%。
| 传统微调 | AutoScientist | |
|---|---|---|
| 优化对象 | 数据或训练配方(分开) | 数据+配方同时优化 |
| 耗时 | 数周(手动反复实验) | 数小时(自动收敛) |
| 所需专业度 | 资深ML工程师必备 | 无需深厚ML知识 |
| 数据处理 | 全量使用(含噪音) | 自动筛选高价值数据,过滤有害噪音 |
核心主张很有力:"大型实验室之外也能进行前沿级别的模型训练。"
核心整理:怎么开始
- 定义目标
明确你需要什么任务的专属模型——越具体越好。 - 准备数据
5,000条以上的样本就能开始。不需要完美清洗,AutoScientist会自动识别高质量数据。 - 运行AutoScientist
在adaptionlabs.ai申请30天免费试用,输入目标,让它跑起来。 - 观察收敛过程
AI自动尝试各种组合,向目标收敛——相当于研究员手动跑几百次实验。 - 部署模型
基于Together AI,支持100B+参数模型,可直接上云服务。




