AI思考
Key Takeaway
- Thinking-Claude通过提示词让AI“假装思考”,展示思考过程,提升回答质量。
- 大模型的输出是一次性完成的,其“思考”是表演而非真正的反馈循环。
- 尽管是“表演”,但这种方式能强制模型产出更有逻辑、更全面的回答,具有实用价值。
- 文章通过苹果M芯片统一桌面端和移动端SoC的例子,展示了Thinking-Claude如何提供有价值的推演过程。
- 该项目通过浏览器插件和提示词设置实现,操作简单,值得尝试。
Full Content
最近有一个17岁的少年一夜爆火,名字叫涂津豪。他通过一套提示词,指导Claude如何进行更深入、更有条理的思考,希望最终能获得更高质量的回答。
不仅如此,涂津豪还做了一个浏览器插件,目的是为了提升可信度。因为装上之后,我们就能看到AI具体的思考过程。
在国内自媒体的带动下,不到24小时,小涂同学被捧上神座。甚至有人拿这个嘲讽OpenAI——既然靠提示词就能实现“慢思考”,那你们费了半天劲搞的o1模型,究竟是在搞什么?
说实话,刚看到这个项目的时候,我也挺吃惊的。因为根据我的经验,提示词工程并没有那么大的能耐,否则我们之前就没必要搞Multi-Agent去讨论和纠错了。但是,开始使用之后,似乎Claude又确实是先思考,然后才给出答案。
那么,问题出在哪儿?
其实,Thinking-Claude玩了一个“障眼法”——它让AI假装思考、表演思考。我们看到的思考过程,都是已经生成的,都是剧本。
哈喽大家好,欢迎来到我的频道。谦虚地说,我是国内少数几个能把关于AI的Why和How讲明白的博主。我提供的东西比教程更值钱。记得点一波关注。如果想链接我,就来newtype社群。已经有600位小伙伴付费加入啦!
回到今天的主题:Thinking-Claude。
我之所以说Thinking-Claude所带来的思考是假的、是一种表演,原因在于,大模型的输出都是一次性完成的。它被训练成了连续生成的模式,根据前一个token来预测下一个token。即使你强迫它在半途中暂停生成token,它也无法对已经生成的token做判断。因为它天生就没有这个机制,那又怎么可能靠你的几句提示词就开窍呢?
打个比方,大模型就像一个水龙头,一旦打开就会滔滔不绝地按照预设的路径流动。而这种机制是与思考相冲突的。
大家可以回想一下我们是怎么写作的。在整个写作过程中,我们会停下来,会回头修改,甚至还会推倒重来。这个就是在思考。这个就是思考的样子——它不是单线程,而是一个反馈循环的机制。
大模型没有这个机制,它只能一口气把答案全告诉你。要改进的话,得等下一轮对话。那现在它又被强制要求去思考,该怎么办呢?
它只能演给你看咯。就跟小朋友一样,表演给大人看。
大模型把自己的产出分成了两部分:一部分用来充当答案,一部分用来充当思考。
这个是技术、架构的局限性,光靠提示词是突破不了的。所以千万别觉得OpenAI是冤大头,白花那么多钱训练个o1出来,还比不过一个17岁的中学生。这些自媒体也太民间科学了。
但是,虽然思考是假的,虽然是在表演,我还是继续使用,并且我也推荐大家使用。因为,表演有表演的价值。
大家可以这么理解。在没有安装这个项目之前,Claude都是在即兴发挥。好在它底子好、演技强,不管怎么演都不太差。只是可能有的时候台词差点意思,毕竟是现喷的,没打磨过。
使用Thinking-Claude就好比是给Claude塞了个剧本,强制要求它按照本子演。所以,提升肯定是有的。只是有时候提升多一些,有时候提升少一些。
这就是我说“表演有表演的价值”的原因。在一个表演这个框架的约束下,强迫模型产出更有逻辑、更加全面的回答,何乐而不为呢?
而且,我其实挺喜欢它所表演的思考的,经常会给我启发,很有价值。
举个例子。我问Claude:为什么苹果需要通过M芯片统一桌面端和移动端设备的SoC?
如果直接看答案的话,是还不错啦,但是好像少了点什么。我们再来看它表演的思考。
在一开始,Claude认为这是一个技术问题。因为x86和ARM是两套完全不同的指令集架构,开发者需要维护两套代码,这就增加了大量的重复工作和成本。
我这边多科普两句。用大白话来说就是,要想让机器理解你的代码,你得做翻译,把你的代码翻译成机器能看得懂的语言。这个过程叫做“编译”,把源代码编译成特定架构的机器码。
x86和ARM对应两套完全不同的机器语言。这就意味着,开发者得做两次翻译,然后还得检查有没有问题,以及做必要的优化——这个真的是非常重的负担。所以,苹果要统一架构。
而且,一旦都改用自己的芯片之后,就不必跟英特尔商量着来了。苹果想怎么搞就怎么搞,都是自己的节奏。这种战略上的自由度是很诱人的。
紧接着,Claude的思考从战略角度延伸到了商业角度和用户体验角度。采用统一架构意味着处理器成本更低,利润空间提升,商业上有好处。并且iOS应用可以直接跑在Mac上,用户体验也提升。
整体来看,统一架构不只是一个技术选择,更是生态层面的战略决策。更加紧密、统一的生态系统,能让苹果在市场竞争和技术创新方面获得更大主导权。这就是苹果这种级别的公司会去做、也应该做的事儿。
你发现没有,Claude所表演的思考,其实给我们提供了一个推演的过程。我觉得这个价值不会比正式答案更低。
所以,大家能安装的都装上试试。过程很简单,就两个部分,有手就行。
第一,安装浏览器插件。
来到Thinking- Claude的GitHub页面,把整个项目的压缩包下载下来,并且解压缩。来到浏览器的插件管理页面,打开开发者模式,然后加载项目里的extention文件夹。
第二,设置提示词。
同样来到GitHub页面,进入这个文件,把里边所有内容都复制下来。接着来到Claude,新建或者打开一个Project。在右边可以添加提示词。把刚才复制的内容全部粘贴进去就搞定了。
可能是感受到了国内自媒体瞎吹捧的危险,在后来的更新中,涂津豪同学特意加了一段话,强调了Claude的能力都是Pre-designed,没法做到大幅提升。而这个项目只是为了向我们展示模型的“内心独白”。
OK,以上就是本期内容。想聊AI,就来我们newtype社群。那咱们下期见!