Kimi新出的Agent集群,到底有多恐怖?
Kimi发布了K2.5模型,并带来了一个名叫“Agent Swarm(Agent集群)”的重磅炸弹。这个新功能把国产AI推向“组织智能”的新高度。
Key Takeaway
K2.5全能模型:开源整合视觉/文本/对话/Agent/思考能力,评测优于GPT-5.2-xhigh,成本仅几分之一,国产最强全能选手。
Agent Swarm集群:动态中继站实现分工+实时信息交换/校准/对齐,3D编排式协作,远超传统2D并发,处理复杂通用场景。
文明级跃迁:AI从单体天才进化组织智能,用户如口袋字节跳动;Beta会员试用,开启硅基文明序幕。
碳基文明的秘密从来不是个人的智商,而是组织,包括分工、协作、规模化。
对于硅基生命来说也是这样。
AI发展到今天,我们见过博闻强记的模型,它们有着超大的上下文窗口;也见过深思熟虑的模型,它们有着超强的推理能力。
但是,这些都还是“天才”,还处于单体智商的极限竞赛。
就在昨天,Kimi发布了K2.5模型,并带来了一个名叫“Agent Swarm(Agent集群)”的重磅炸弹。这个新功能把国产AI推向“组织智能”的新高度。
先说K2.5。
用一个关键词来概括这个模型的话,那就是“全能”。
怎么个全能法?
K2.5把视觉和文本,对话和Agent调用,思考和非思考——所有你目前能想到的关键能力,全都集中到一个模型里边。而且在全能的情况下,它在各项评测中都取得了极佳的表现。
另外,你别忘了,K2.5还是一款开源模型。它在多项评测中优于GPT-5.2-xhigh,但成本只有对方的几分之一。OpenAI万亿美元护城河又塌了一些。
那么问题来了:
模型发展有那么多方向,Kimi为什么非要把所有能力全塞进一个模型?
因为只有全能的模型,才能驱动得了最新的Agent集群功能,才能实现Kimi在这个阶段的野心。
我不知道Kimi是不是一开始就规划好的。回过头来看的话,确实他们的模型发展路径特别有一种“Scale三部曲”的感觉。
三部曲的第一阶段是Kimi 1.0时期。模型的代表能力是Memory。AI学会像人一样去记忆。
在这个阶段,Kimi卷的是“长度”,上下文的长度。
第二阶段是Kimi 1.5到2.0时期。模型的代表能力是Reasoning和Tool-use。AI学会像人一样去思考和使用工具,尤其是在长程任务当中。
在这个阶段,Kimi卷的是“深度”,推理的深度。
前两个阶段提升的其实都是单体智商。但是,要实现AGI,光靠超级天才是不够的——必须把一群天才组织起来。
有组织的智能才是文明。这才是AGI要达到的高度。
于是,第三阶段的Kimi开始卷“协作”——让AI自己组织AI。代表模型就是这次推出的K2.5。
有了全能的K2.5,无论你需要什么样的子Agent,要并发多少个,它都能实现、都能协调。
我给你们演示一下就更明白了。
第一个例子,我让Kimi去所有主要学术和技术资源库做一次大规模的文献扫荡,然后识别并编目所有论文、报告和官方文档。
这个任务需要Kimi具备极强的专业能力,否则连找都找不着,更别提之后的整理了。另外,因为是文献扫荡,所以工作量很大,很考验并行处理的能力。
接到任务后,Kimi生成了四个子Agent,分别负责不同的渠道,比如arXiv、GitHub等等。每个子Agent都被交代了详细的要求,比如时间范围、作者、主题关键词等等。
然后,四个子Agent领了任务就同时开工了。在主界面的下方可以看到它们的工作进度。点进去可以看到详情,知道进展到哪一步了。当某个子Agent完工了,下方有气泡提示,左边栏的进度条也会走满。
当所有子Agent都完成任务后,一切都会汇总到主Agent这边。它会整合所有搜索结果开始创建最终的报告,包括可视化分析等等。
这个过程会涉及到到文档的撰写,也经常会需要编写代码。还好背后的模型是K2.5,足够全能,否则不可能这么顺滑。
一切搞定之后,交付物都会存在虚拟机的文件夹内,其中包括几十篇高质量文献,以及一份非常详尽的报告。如果是人来干且要短时间完成的话,得来一个课题小组吧。
刚才这个例子非常有代表性。
几乎所有专业领域的人才,时薪都非常高。你要想请他们帮你找找资料、做点分析,得付出大价钱。现在有了Kimi的Agent集群,你就可以“用算力换时薪”:
只需要付出一点点算力成本,你就可以让AI专家等等帮你干活。随叫随到,毫无怨言。这个在以前是根本不敢想的。
而且Kimi的Agent集群可以处理高达1500轮的工具调用,短时间就能完成高负荷的工作。
刚才的例子属于理工科。咱们再来看个文科的例子。
我希望Kimi针对高达动画《闪光的哈萨维》的第一场战斗做个拉片分析,就是一帧帧地拆解镜头语言。
接到需求后,Kimi做了两件事:
第一,生成Subagent。一共有四个,分别是战斗分析师、视觉分析师、构图分析师和身份分析师。
你看,从这四个分析师的配置就看得出来,Kimi对这个分析任务做了拆解。它知道要从哪几个方面切入,于是才有了战斗、视觉、构图和身份四个部分。
第二,分配任务。四个专业分析师同时开工,并行工作,这样能保证效率。等它们都完成后,主Agent再进行整合,形成完整的拉片报告。
最终的报告还是挺有料的,包括对战况节奏、视听语言的分析,尤其是还点到了导演的核心意图——这个特别棒。
但是,光有文字的分析还不够。我在想,能不能加点配图呢?
于是,我让Kimi创建表格形式的分析报告,并且附上手绘风格的分镜图。
这个就是全能模型的好处。当你需要图片的时候,它可以调用多模态能力直接生成。这种手绘的感觉还挺好的,不是吗?
通过刚才的演示,你就知道,什么叫真正的“Agent集群”。
第一,它是“角色涌现”的。
真正的Agent集群绝不是被程序员写死的流程图。
过去两年,有无数团队在做Multi-Agent System。他们定义角色、设计流程、编写规则——这本质上还是人在组织AI,只是很初级的集群,只能做一些线性任务。
而Kimi正在做的Agent集群,是像人类社会一样,可以根据任务临时组建一支特种部队——有的Agent负责看财报,有的Agent负责搜新闻,有的Agent负责写代码。
Agent永远跟随需求流动——它们欣赏得了动画,也看得懂AI论文,不会被锁死在固定的岗位上。
第二,它是“3D编排”的。
以Manus Wide Research为代表的Agent是“2D并发”的。它让100个实习生同时去搬砖,各干各的,最后把结果堆在一起。只有分头,没有协作。
而Kimi的Agent集群拥有“动态中继站”。它们可以在关键节点停下来,交换信息,互相校准,然后再开始下一阶段的创作。有分工,也有对齐。所以我说这是一种“3D编排式协作”。
今天的AI,面对的是更加复杂、更加通用的场景。靠单独的Agent不行,靠像预制菜一样的多Agent也不太灵。真的需要因地制宜、实时生成。所有角色分配、任务拆解,都由AI现场即时决定。
对于用户来说,你拿到的不是一个更聪明的模型,而是“口袋里的字节跳动”。
对于AI这种硅基生命来说,这是从“天才”进化到“文明”的开始。
目前Agent集群功能处于Beta阶段,如果你是Kimi会员的话,一定去试试。
OK,以上就是本期内容。想了解AI,想成为超级个体,想找到志同道合的人,就来我们newtype社群。那咱们下期见!


老师,请问是不是这里的内容和patron一样?请问有会员群吗,想请教技术问题。