2026年最重要的开源项目:AutoResearch
AutoResearch可能是今年最重要的开源项目。它给了Agent自我优化的能力,让Agent在执行任务的过程中自己进行评估、迭代,直到完成任务。这种设计思路对于提升Agent系统性能可太重要了!
Key Takeaway
AutoResearch核心机制:只需三个文件(program.md定义目标/规则/约束、train.py供Agent修改、prepare.py自动评估),Agent就能提出假设、修改代码、运行实验、自我打分、迭代优化,直到达标,实现了真正的自我进化。
适用范围极广:原本用于机器学习,但社区魔改后可泛化到内容创作、营销邮件等任何可量化、可结构化的工作。只要你能定义清晰的评估指标,Agent就能不知疲倦地反复迭代,作者测试营销邮件30轮后得分提升11倍。
人机协作新范式:人类负责定义边界和评估标准,Agent负责执行和优化;这是AI时代最重要开源项目,作者强烈建议亲自上手测试可量化任务,尽早适应“Agent自我迭代”的生产力跃迁。
今年最重要开源项目肯定是AutoResearch,没有之一。
因为它给了Agent自我优化的能力,让Agent在执行任务的过程中自己进行评估、迭代,直到完成任务。
为什么说它最重要?
因为今天Agent最大的瓶颈不在于能力够不够强,而在于执行之后,它不知道结果好不好。
AutoResearch厉害的地方就在这里。它只用三个文件,就非常简单、非常优雅地解决了这个问题。
一个是program.md,用来存放人类写的目标、规则和约束。对这个文档,Agent只能读,不能改。
一个是train.py,也就是项目文件,Agent可以随意修改。
最后是prepare.py,它是评估脚本。Agent不能改,否则会作弊。
启动之后,Agent不会一下就生成答案,而是先提出假设,然后开始修改;改完之后,运行实验,用评估脚本来打分;好的就保留,坏的就丢弃重来。
也就是说,AutoResearch其实是把自我评估和迭代变成了一个标准循环。能做什么、不能做什么,以及完成的标准都在文档里写得明明白白。Agent就自己干去,自己想办法解决,直到搞定。
AutoResearch本身是用于机器学习的项目。但是它开源,而且结构简单,所以现在已经被各种修改、应用到其他领域了,比如广告营销、内容创作等等。
只要你能定义一个清晰、可自动测量的指标,AutoResearch就能用在任何领域。
这个就是我说它是今年最重要的开源项目的原因。本期视频,咱们来详细聊一下这个项目。
哈喽各位好,欢迎回到我的频道。谦虚地说,我是国内少数几个能把关于AI的Why和How讲明白的博主。我提供的东西远比教程更值钱。记得点一波关注。如果想链接我,就来我们newtype社群。这个社群已经运营700天,有超过2000位小伙伴付费加入啦。
如果你是国内用户,可以从知识星球加入。如果你是海外用户,可以从Substack加入。我的第一套课程、日常的Newsletter以及专属视频,在社群内都可以看到。
回到今天的主题:AutoResearch。
AutoResearch是AI大神卡帕西的最新作品。他之前是OpenAI联合创始人、Tesla Autopilot主要负责人。非常火的概念“Vibe Coding”就是他提出的。
AutoResearch项目推出之后,国内没什么反响。但我自己体验下来,是挺震惊的。就像我在星球里说的:
那些能够很容易被衡量、被结构化的人类工作,将率先受到AI替代的冲击。
你看,我先把这个社区魔改版的AutoResearch下载到本地。这个版本跟原版的区别是,把它变得更加通用了。
我要做的测试很简单:让Agent帮我迭代一封营销邮件,更个性化、更简洁,以及更容易让用户行动。我会给它一个非常非常基础的邮件版本,以及一套衡量标准。
在OpenCode里启动之后,Agent就在AutoResearch的指导下开工了。它先了解清楚项目需求和规则。然后,它对邮件最初版本打了一个分,这个是基础得分。接下来,就开始持续30轮的迭代。
每一次迭代,Agent都会照着我给的标准进行衡量,搞清楚哪里做对了,哪里还有改进空间,以及决定下一轮要改哪里。
就这样,30轮下来,这封邮件的得分提升了11倍!
虽然这只是一个很简单、很粗糙的测试,但是卡帕西做AutoResearch的思路我是get到了。总结起来有两点:
第一,不要怕约束。对Agent来说,有约束可能反而是好事。
如果你给它一堆模糊的指标,它真的只能撞大运。相反,你给它一堆条条框框,它可以在这个有限的区间内不断深挖、不断优化。
需要创意发散的场景是少数。我们日常很多工作其实都有清晰的边界、严格的约束。只是多数人由于种种原因不去界定清楚,把简单的事情搞复杂了。
第二,人类下定义。Agent来执行。
AutoResearch项目中的三个文档,两个需要人类来制定。有了那两个文档之后,Agent可以不知疲倦地开始反复优化。
我坚信这就是当下以及未来很长一段时间人与AI的协作方式。可惜的是,很多人还是无法从执行者的角色中跳出来。很遗憾,这些人只能被淘汰。
我真心建议大家看完这个视频之后,去试试AutoResearch这个项目。把你手上那些可以用数字衡量的工作交给它来试一试。这些关键的事情,还是得亲自上手才有体验。
OK,以上就是本期内容。想了解AI,想成为超级个体,想找到志同道合的人,就来我们newtype社群。那咱们下期见!

