2026年最重要的开源项目：AutoResearch

Apr 02, 2026

AutoResearch核心机制：只需三个文件（program.md定义目标/规则/约束、train.py供Agent修改、prepare.py自动评估），Agent就能提出假设、修改代码、运行实验、自我打分、迭代优化，直到达标，实现了真正的自我进化。
适用范围极广：原本用于机器学习，但社区魔改后可泛化到内容创作、营销邮件等任何可量化、可结构化的工作。只要你能定义清晰的评估指标，Agent就能不知疲倦地反复迭代，作者测试营销邮件30轮后得分提升11倍。
人机协作新范式：人类负责定义边界和评估标准，Agent负责执行和优化；这是AI时代最重要开源项目，作者强烈建议亲自上手测试可量化任务，尽早适应“Agent自我迭代”的生产力跃迁。

今年最重要开源项目肯定是AutoResearch，没有之一。

因为它给了Agent自我优化的能力，让Agent在执行任务的过程中自己进行评估、迭代，直到完成任务。

为什么说它最重要？

因为今天Agent最大的瓶颈不在于能力够不够强，而在于执行之后，它不知道结果好不好。

AutoResearch厉害的地方就在这里。它只用三个文件，就非常简单、非常优雅地解决了这个问题。

一个是program.md，用来存放人类写的目标、规则和约束。对这个文档，Agent只能读，不能改。

一个是train.py，也就是项目文件，Agent可以随意修改。

最后是prepare.py，它是评估脚本。Agent不能改，否则会作弊。

启动之后，Agent不会一下就生成答案，而是先提出假设，然后开始修改；改完之后，运行实验，用评估脚本来打分；好的就保留，坏的就丢弃重来。

也就是说，AutoResearch其实是把自我评估和迭代变成了一个标准循环。能做什么、不能做什么，以及完成的标准都在文档里写得明明白白。Agent就自己干去，自己想办法解决，直到搞定。

AutoResearch本身是用于机器学习的项目。但是它开源，而且结构简单，所以现在已经被各种修改、应用到其他领域了，比如广告营销、内容创作等等。

只要你能定义一个清晰、可自动测量的指标，AutoResearch就能用在任何领域。

这个就是我说它是今年最重要的开源项目的原因。本期视频，咱们来详细聊一下这个项目。

哈喽各位好，欢迎回到我的频道。谦虚地说，我是国内少数几个能把关于AI的Why和How讲明白的博主。我提供的东西远比教程更值钱。记得点一波关注。如果想链接我，就来我们newtype社群。这个社群已经运营700天，有超过2000位小伙伴付费加入啦。

如果你是国内用户，可以从知识星球加入。如果你是海外用户，可以从Substack加入。我的第一套课程、日常的Newsletter以及专属视频，在社群内都可以看到。

回到今天的主题：AutoResearch。

AutoResearch是AI大神卡帕西的最新作品。他之前是OpenAI联合创始人、Tesla Autopilot主要负责人。非常火的概念“Vibe Coding”就是他提出的。

AutoResearch项目推出之后，国内没什么反响。但我自己体验下来，是挺震惊的。就像我在星球里说的：

那些能够很容易被衡量、被结构化的人类工作，将率先受到AI替代的冲击。

你看，我先把这个社区魔改版的AutoResearch下载到本地。这个版本跟原版的区别是，把它变得更加通用了。

我要做的测试很简单：让Agent帮我迭代一封营销邮件，更个性化、更简洁，以及更容易让用户行动。我会给它一个非常非常基础的邮件版本，以及一套衡量标准。

在OpenCode里启动之后，Agent就在AutoResearch的指导下开工了。它先了解清楚项目需求和规则。然后，它对邮件最初版本打了一个分，这个是基础得分。接下来，就开始持续30轮的迭代。

每一次迭代，Agent都会照着我给的标准进行衡量，搞清楚哪里做对了，哪里还有改进空间，以及决定下一轮要改哪里。

就这样，30轮下来，这封邮件的得分提升了11倍！

虽然这只是一个很简单、很粗糙的测试，但是卡帕西做AutoResearch的思路我是get到了。总结起来有两点：

第一，不要怕约束。对Agent来说，有约束可能反而是好事。

如果你给它一堆模糊的指标，它真的只能撞大运。相反，你给它一堆条条框框，它可以在这个有限的区间内不断深挖、不断优化。

需要创意发散的场景是少数。我们日常很多工作其实都有清晰的边界、严格的约束。只是多数人由于种种原因不去界定清楚，把简单的事情搞复杂了。

第二，人类下定义。Agent来执行。

AutoResearch项目中的三个文档，两个需要人类来制定。有了那两个文档之后，Agent可以不知疲倦地开始反复优化。

我坚信这就是当下以及未来很长一段时间人与AI的协作方式。可惜的是，很多人还是无法从执行者的角色中跳出来。很遗憾，这些人只能被淘汰。

我真心建议大家看完这个视频之后，去试试AutoResearch这个项目。把你手上那些可以用数字衡量的工作交给它来试一试。这些关键的事情，还是得亲自上手才有体验。

OK，以上就是本期内容。想了解AI，想成为超级个体，想找到志同道合的人，就来我们newtype社群。那咱们下期见！

newtype