你可能知道 Andrej Karpathy——特斯拉前 AI 总监、OpenAI 联合创始人、"vibe coding"一词的创造者。
前几天他在 X 上发了一个新项目,没怎么推广,直接炸了。
这个项目叫什么?
autoresearch
开源地址:github.com/karpathy/autoresearch
24 小时内 GitHub 8,000 多星,VentureBeat、Fortune,科技圈 KOL 全部跟进报道。
它做了什么?
一句话:让 AI 自己设计实验、自己跑实验、自己分析结果,人只需要睡觉。
Karpathy 把它类比成 SETI@home——当年全世界人民贡献自己电脑的闲置算力一起找外星人信号。现在是全世界 AI 研究者贡献自己的想法,让 AI Agent 异步协作、规模化验证。
核心逻辑:
- 你给 AI 一个研究方向和评估标准
- AI 自己设计实验参数,写代码、跑实验
- 自动记录每次实验的结果
- 持续迭代,直到跑出最优解
实际效果怎么样?
Shopify CEO Tobias Lütke 试了一下:
"让 autoresearch 优化公司内部 AI 模型质量,只用了一晚上。跑了 37 次实验,性能提升 19%。"
原理是什么?
autoresearch 本质上是一个多智能体异步实验框架:
| Agent | 职责 |
|---|---|
| Researcher Agent | 负责提出假设,设计实验 |
| Executor Agent | 负责执行代码、跑实验 |
| Critic Agent | 负责评估结果、淘汰低质量实验 |
| Archivist | 负责记录每次实验的输入输出,形成实验数据库 |
对普通人意味着什么?
以前:你有想法,但没资源、没时间、不知道怎么验证
现在:你有想法,AI 帮你设计实验、跑实验、给你报告
适合场景:调 AI 模型超参数 / 优化 Prompt 组合 / 测试 RAG 策略 / 对比 Agent 架构性能
你定方向,AI 做苦力。
安装方式
git clone https://github.com/karpathy/autoresearch.git
cd autoresearch
pip install -e .
python -m autoresearch.run --task "优化我的模型在 X 数据上的准确率"
一句话总结
Karpathy 的 autoresearch,让 AI 从"你让它做什么它做什么",变成"你告诉它目标,它自己想办法达到目标"。
下一个阶段不是 AI 帮你写代码,是 AI 帮你做研究。
#AI
#Karpathy
#autoresearch
#AI研究
#开源
#Agent