GPTResearcher

AI需要「影分身」

Key Takeaway

  • ChatGPT“裸奔”不足以满足生产力需求,部署Agent能显著提升效率。
  • GPT Researcher是开箱即用的Agent方案,擅长资料搜集和报告生成,成本低廉。
  • CrewAI是灵活的Agent框架,通过设定Agent、Tool和Task实现自由搭建Agent系统。
  • 大模型存在“单核硬伤”(Degeneration-of-Thought),多Agent协作能有效解决复杂推理问题。
  • Agent技术在大模型加持下迅速发展,未来将有更多工具和应用出现。

Full Content

ChatGPT会员我是不会再继续订阅了。

轻度体验一下还可以。但如果真要把它当作生产力工具长期使用的话,还是不太行。

咱们来做个对比。同样一个问题:

GPT-4加上联机搜索之后,ChatGPT给出了这样的答案:

你觉得还不错是吧?我给你看看Agent生成的:

也不能说是差距很大,大概就是能用和不能用的区别吧。

所以,从实用的角度来看,我建议大家别再继续用ChatGPT「裸奔」了。花点时间部署一套Agent,能帮你省下非常多时间。

介绍一下我目前在用的两套方案。

GPT Researcher:开箱即用

GPT Researcher是GitHub上的一个项目,主要满足资料搜集、报告生成方面的需求——日常工作刚需,真的能省很多时间。

GPT Researcher搭建了两类Agent:

Planner Agent负责拆解需求、生成尽可能全的问题。Execution Agent拿到问题之后,找到对应的网页、把内容爬下来,再交回给Planner Agent。后者筛选、汇总所有资料,完成调研报告。

这个项目有两点做得很棒:

  1. 混合使用GPT-3.5和GPT-4,提升速度、降低成本。一般来说,跑一圈下来需要3分钟,花费0.1美元——真的是白菜价了。
  2. 根据需求生成的Agent都是特定领域的。比如,需求是做金融领域的调研,那么生成的Agent就是金融专家。

只需要懂一点点代码就可以使用GPT Researcher。按照GitHub的教程,把仓库克隆到本地,然后一步一步复制粘贴、执行对应的命令。过程中如果提示缺什么Package,那就pip install安装就行。最后打开一个本地网页就可以使用了。

CrewAI:自由搭建

如果你的需求不只是生成调研报告,那就需要使用现成的框架,亲手搭建一套Agent系统了。

我目前在用的Agent框架叫「CrewAI」。看起来跟微软的AutoGen差不多,但你一上手就会发现,CrewAI比AutoGen逻辑更简单、更直观。

在CrewAI里,你只需要设定三个要素:

  1. 谁。
  2. 用什么。
  3. 做什么。

「谁」指的是Agent。多少个Agent,分别以什么角色进行协作,工作目标是什么,他们各自的背景是什么样的,他们用什么模型作为大脑。

「用什么」指的是Tool。最常见的就是搜索工具。你需要把工具分配给具体使用的Agent。

「做什么」指的是Task。一个项目可以分拆成很多个任务。每个任务需要有具体的描述,以及指定由哪些Agent来完成。

一旦理解了这个逻辑之后,CrewAI的设置就变得极其简单。

还以生成调研报告为例,这是我设计的Agent工作流程:

我特意在最开始的需求分析、方案制定环节安排了两个Agent。这么做,Token花得多,时间也更长,不过很有必要。一切都是为了解决一个核心问题:

大模型在复杂推理的时候,特别容易犯轴。

单核的硬伤

为了加强大模型的推理能力,研发人员想了很多办法。比如,大名鼎鼎的思维链(Chain-of-Thought),还有自我反思(Self-Reflection)。

但是,无论怎么给大模型叠Buff,都改不了这个问题,在论文里管它叫「Degeneration-of-Thought」:

当大模型对自己的答案有信心的时候,即使这个答案不正确,它都没法再通过自我反思去产生新的想法。

跟人一样,沉浸在自己的世界里,迷之自信、死不悔改。

造成这个问题的原因有很多。比如在预训练阶段,输入的概念有偏差,或者思考模式有问题,都会产生认知偏差。

有的问题可以通过技术解决,有的不需要。像这个问题,其实人类社会已经有解了,就是大家最最熟悉的:

讨论与协作。

一个人再聪明,认知水平再高,都会有盲点。

有人点拨的话——其实有时都不用点拨,只要跟自己以外的人聊上几句,就能爬出来。

这就是为什么,都是一样的大模型作为底层驱动,「多核」会比「单核」靠谱得多。

2024 Agent

Agent并不是跟着大模型兴起的。早在这一轮AI爆发之前,Agent就已经有好多年的研究了。大模型充当最强大脑,解决了Agent推理的难题,使得Agent突然被所有人关注。

在设计和部署Agent方面,AutoGen之后有了CrewAI,2024年肯定还会有更多团队想来试一试的。