← 返回文章列表

你可能知道 Andrej Karpathy——特斯拉前 AI 总监、OpenAI 联合创始人、"vibe coding"一词的创造者。

前几天他在 X 上发了一个新项目,没怎么推广,直接炸了。

这个项目叫什么?

autoresearch

开源地址:github.com/karpathy/autoresearch

24 小时内 GitHub 8,000 多星,VentureBeat、Fortune,科技圈 KOL 全部跟进报道。

它做了什么?

一句话:让 AI 自己设计实验、自己跑实验、自己分析结果,人只需要睡觉。

Karpathy 把它类比成 SETI@home——当年全世界人民贡献自己电脑的闲置算力一起找外星人信号。现在是全世界 AI 研究者贡献自己的想法,让 AI Agent 异步协作、规模化验证。

核心逻辑:

  1. 你给 AI 一个研究方向和评估标准
  2. AI 自己设计实验参数,写代码、跑实验
  3. 自动记录每次实验的结果
  4. 持续迭代,直到跑出最优解

实际效果怎么样?

Shopify CEO Tobias Lütke 试了一下:

"让 autoresearch 优化公司内部 AI 模型质量,只用了一晚上。跑了 37 次实验,性能提升 19%。"

原理是什么?

autoresearch 本质上是一个多智能体异步实验框架

Agent职责
Researcher Agent负责提出假设,设计实验
Executor Agent负责执行代码、跑实验
Critic Agent负责评估结果、淘汰低质量实验
Archivist负责记录每次实验的输入输出,形成实验数据库

对普通人意味着什么?

以前:你有想法,但没资源、没时间、不知道怎么验证

现在:你有想法,AI 帮你设计实验、跑实验、给你报告

适合场景:调 AI 模型超参数 / 优化 Prompt 组合 / 测试 RAG 策略 / 对比 Agent 架构性能

你定方向,AI 做苦力。

安装方式

git clone https://github.com/karpathy/autoresearch.git
cd autoresearch
pip install -e .
python -m autoresearch.run --task "优化我的模型在 X 数据上的准确率"

一句话总结

Karpathy 的 autoresearch,让 AI 从"你让它做什么它做什么",变成"你告诉它目标,它自己想办法达到目标"。

下一个阶段不是 AI 帮你写代码,是 AI 帮你做研究。


#AI #Karpathy #autoresearch #AI研究 #开源 #Agent