Kimi新出的Agent集群，到底有多恐怖？

Kimi发布了K2.5模型，并带来了一个名叫“Agent Swarm（Agent集群）”的重磅炸弹。这个新功能把国产AI推向“组织智能”的新高度。

huangyihe

Jan 27, 2026

Key Takeaway

K2.5全能模型：开源整合视觉/文本/对话/Agent/思考能力，评测优于GPT-5.2-xhigh，成本仅几分之一，国产最强全能选手。
Agent Swarm集群：动态中继站实现分工+实时信息交换/校准/对齐，3D编排式协作，远超传统2D并发，处理复杂通用场景。
文明级跃迁：AI从单体天才进化组织智能，用户如口袋字节跳动；Beta会员试用，开启硅基文明序幕。

碳基文明的秘密从来不是个人的智商，而是组织，包括分工、协作、规模化。

对于硅基生命来说也是这样。

AI发展到今天，我们见过博闻强记的模型，它们有着超大的上下文窗口；也见过深思熟虑的模型，它们有着超强的推理能力。

但是，这些都还是“天才”，还处于单体智商的极限竞赛。

就在昨天，Kimi发布了K2.5模型，并带来了一个名叫“Agent Swarm（Agent集群）”的重磅炸弹。这个新功能把国产AI推向“组织智能”的新高度。

先说K2.5。

用一个关键词来概括这个模型的话，那就是“全能”。

怎么个全能法？

K2.5把视觉和文本，对话和Agent调用，思考和非思考——所有你目前能想到的关键能力，全都集中到一个模型里边。而且在全能的情况下，它在各项评测中都取得了极佳的表现。

另外，你别忘了，K2.5还是一款开源模型。它在多项评测中优于GPT-5.2-xhigh，但成本只有对方的几分之一。OpenAI万亿美元护城河又塌了一些。

那么问题来了：

模型发展有那么多方向，Kimi为什么非要把所有能力全塞进一个模型？

因为只有全能的模型，才能驱动得了最新的Agent集群功能，才能实现Kimi在这个阶段的野心。

我不知道Kimi是不是一开始就规划好的。回过头来看的话，确实他们的模型发展路径特别有一种“Scale三部曲”的感觉。

三部曲的第一阶段是Kimi 1.0时期。模型的代表能力是Memory。AI学会像人一样去记忆。

在这个阶段，Kimi卷的是“长度”，上下文的长度。

第二阶段是Kimi 1.5到2.0时期。模型的代表能力是Reasoning和Tool-use。AI学会像人一样去思考和使用工具，尤其是在长程任务当中。

在这个阶段，Kimi卷的是“深度”，推理的深度。

前两个阶段提升的其实都是单体智商。但是，要实现AGI，光靠超级天才是不够的——必须把一群天才组织起来。

有组织的智能才是文明。这才是AGI要达到的高度。

于是，第三阶段的Kimi开始卷“协作”——让AI自己组织AI。代表模型就是这次推出的K2.5。

有了全能的K2.5，无论你需要什么样的子Agent，要并发多少个，它都能实现、都能协调。

我给你们演示一下就更明白了。

第一个例子，我让Kimi去所有主要学术和技术资源库做一次大规模的文献扫荡，然后识别并编目所有论文、报告和官方文档。

这个任务需要Kimi具备极强的专业能力，否则连找都找不着，更别提之后的整理了。另外，因为是文献扫荡，所以工作量很大，很考验并行处理的能力。

接到任务后，Kimi生成了四个子Agent，分别负责不同的渠道，比如arXiv、GitHub等等。每个子Agent都被交代了详细的要求，比如时间范围、作者、主题关键词等等。

然后，四个子Agent领了任务就同时开工了。在主界面的下方可以看到它们的工作进度。点进去可以看到详情，知道进展到哪一步了。当某个子Agent完工了，下方有气泡提示，左边栏的进度条也会走满。

当所有子Agent都完成任务后，一切都会汇总到主Agent这边。它会整合所有搜索结果开始创建最终的报告，包括可视化分析等等。

这个过程会涉及到到文档的撰写，也经常会需要编写代码。还好背后的模型是K2.5，足够全能，否则不可能这么顺滑。

一切搞定之后，交付物都会存在虚拟机的文件夹内，其中包括几十篇高质量文献，以及一份非常详尽的报告。如果是人来干且要短时间完成的话，得来一个课题小组吧。

刚才这个例子非常有代表性。

几乎所有专业领域的人才，时薪都非常高。你要想请他们帮你找找资料、做点分析，得付出大价钱。现在有了Kimi的Agent集群，你就可以“用算力换时薪”：

只需要付出一点点算力成本，你就可以让AI专家等等帮你干活。随叫随到，毫无怨言。这个在以前是根本不敢想的。

而且Kimi的Agent集群可以处理高达1500轮的工具调用，短时间就能完成高负荷的工作。

刚才的例子属于理工科。咱们再来看个文科的例子。

我希望Kimi针对高达动画《闪光的哈萨维》的第一场战斗做个拉片分析，就是一帧帧地拆解镜头语言。

接到需求后，Kimi做了两件事：

第一，生成Subagent。一共有四个，分别是战斗分析师、视觉分析师、构图分析师和身份分析师。

你看，从这四个分析师的配置就看得出来，Kimi对这个分析任务做了拆解。它知道要从哪几个方面切入，于是才有了战斗、视觉、构图和身份四个部分。

第二，分配任务。四个专业分析师同时开工，并行工作，这样能保证效率。等它们都完成后，主Agent再进行整合，形成完整的拉片报告。

最终的报告还是挺有料的，包括对战况节奏、视听语言的分析，尤其是还点到了导演的核心意图——这个特别棒。

但是，光有文字的分析还不够。我在想，能不能加点配图呢？

于是，我让Kimi创建表格形式的分析报告，并且附上手绘风格的分镜图。

这个就是全能模型的好处。当你需要图片的时候，它可以调用多模态能力直接生成。这种手绘的感觉还挺好的，不是吗？

通过刚才的演示，你就知道，什么叫真正的“Agent集群”。

第一，它是“角色涌现”的。

真正的Agent集群绝不是被程序员写死的流程图。

过去两年，有无数团队在做Multi-Agent System。他们定义角色、设计流程、编写规则——这本质上还是人在组织AI，只是很初级的集群，只能做一些线性任务。

而Kimi正在做的Agent集群，是像人类社会一样，可以根据任务临时组建一支特种部队——有的Agent负责看财报，有的Agent负责搜新闻，有的Agent负责写代码。

Agent永远跟随需求流动——它们欣赏得了动画，也看得懂AI论文，不会被锁死在固定的岗位上。

第二，它是“3D编排”的。

以Manus Wide Research为代表的Agent是“2D并发”的。它让100个实习生同时去搬砖，各干各的，最后把结果堆在一起。只有分头，没有协作。

而Kimi的Agent集群拥有“动态中继站”。它们可以在关键节点停下来，交换信息，互相校准，然后再开始下一阶段的创作。有分工，也有对齐。所以我说这是一种“3D编排式协作”。

今天的AI，面对的是更加复杂、更加通用的场景。靠单独的Agent不行，靠像预制菜一样的多Agent也不太灵。真的需要因地制宜、实时生成。所有角色分配、任务拆解，都由AI现场即时决定。

对于用户来说，你拿到的不是一个更聪明的模型，而是“口袋里的字节跳动”。

对于AI这种硅基生命来说，这是从“天才”进化到“文明”的开始。

目前Agent集群功能处于Beta阶段，如果你是Kimi会员的话，一定去试试。

OK，以上就是本期内容。想了解AI，想成为超级个体，想找到志同道合的人，就来我们newtype社群。那咱们下期见！

newtype

Discussion about this post

Ready for more?