提示词

用提示词组成工作流 2024-08-31

Key Takeaway

Prompt House是一款用于提示词管理和调用的工具，通过MCP协议实现模型自动获取和使用提示词，从而串联组成工作流。
作者通过Mac版Prompt House演示了如何在一个提示词中嵌套多个MCP工具和提示词，实现复杂任务的自动化。
Prompt House的核心价值在于将MCP工具和提示词结合，形成基于Workflow的自动化能力。
Mac版Prompt House相比网页版具有数据本地存储、更强大的AI润色功能（支持本地模型或自定义API Key）和更快的速度。
文章强调了AI时代产品应“水涨船高”，通过产品传递方法论，并持续开发新功能以满足用户需求。

Full Content

我终于把Mac版的Prompt House做出来了。

搞这个Mac版可比开发网页版麻烦多了。花了我小一周的时间，两百美元成本，用目前最先进的编程模型Claude Opus 4怼出来的。

我老婆说我鬓角多了两根白头发。我说，白头发OK，没秃就行。

过程中的困难我在这边就不多说了。之前在社群内发过好长的一段总结，大家可以自己去看。那么，我之所以废了这么大力气搞出网页版和Mac版，是因为我有一套提示词进阶用法，但是市面上没有这样的工具能实现。那我就自己做咯。

我给你们演示一下，你们就明白它的价值了。

我在Prompt House里事先准备了两份提示词：

1、深度研究：明确要求使用两个MCP工具——Sequential Thinking和Tavily进行至少三轮的轮拆解、分析、搜集。当完成后，使用另一份提示词“总结报告”完成最终输出。

2、总结报告：要求逻辑清晰、结构合理、表达简洁等，并且每个小结都必须有明确结论和支撑。

来到客户端（我这边用的是ChatWise），我@prompthouse，要求进行深度研究。

于是，模型知道两点：第一，要使用Prompt House MCP；第二，要获取关于深度研究的提示词。

所以，模型先调用第一个工具获取Prompt House上所有提示词的列表，从中找到“深度研究”提示词，然后获取这份提示词的完整内容。

因为在这份提示词里，我明确要求组合使用两个MCP工具进行多轮研究，所以模型开始调用Sequential Thinking和Tavily，一个分析、一个搜集，把需要的资料收集齐。

当资料都搞定之后，就该输出最终的报告了。

因为我在“深度研究”这份提示词的结尾明确要求了，如果要输出报告，就必须使用另外一份“总结报告”提示词。于是，模型再次调用Prompt House MCP，拿到“总结报告”提示词，根据里边的详细要求，完成整份报告的输出。

你看，在Prompt House的串联下，模型自动跑完了一整个工作流，里边涉及到多个MCP工具的调用，还涉及到多份提示词。

今天有那么多的MCP工具。那么，什么时候用什么工具？工具之间如何组合使用？这些都可以在一份提示词里交代清楚。

你也不需要在一份提示词里把所有工作都交代完成。完全可以拆成小的子任务，放在多份提示词里边。然后根据需要，灵活挑选几份、组合使用。

有了Prompt House作为调度枢纽，我们就有了一个基于MCP tools + Prompts的Workflow，足以自动化完成一些复杂任务。

我之前在社群内说过，所有工具、所有SaaS的核心，是方法论。通过Prompt House这个产品，我把我关于提示词的方法论充分表达，分享给大家。

模型调用工具的能力越强、上下文长度越大，这套方法论和工具能实现的价值就越大。我坚信，AI时代，一定要做水涨船高的产品。

如果你get到了，欢迎登录prompthouse.app这个网站使用。网页版免费。

如果你想长期使用，建议购买Mac版。点击网页左下角的Purchase就可以购买，9.98美元。我想了一下，还是不搞订阅制了。采用买断制，大家都舒服。

为什么要花这9.98美元呢？使用Mac版有这三个好处：

第一，数据全都存在本地，你不用担心隐私的问题。

第二，“AI润色”功能更强大。网页版用的是我的API Key。为了节省成本，我选择GPT-4o mini。性能差一些，但是白菜价。

到了Mac版这边，大家有两个选择：可以使用Ollama调用开源模型。或者，用自己的API Key，选择更好的模型，比如GPT-4.1。

“AI润色”功能不仅可以帮你润色提示词内容，还可以生成标题和标签。这样你就不用花心思去想这些了。对模型来说，准确的标题、丰富的标签能显著提升它的筛选效率和准确率。

第三，速度更快，体验更好。毕竟是一款软件，用起来肯定比网页顺畅。而且MCP服务器是在本地，所以连接速度也更快。

目前功能都是Prompt House的MVP功能。在此基础上，从下周开始，我还有好几个功能会陆续开发。比如，提示词的推荐功能。我会持续搜集好用的提示词，通过产品推送给用户。用户点个收藏就能保存进自己的提示词仓库里。

让Claude假装思考：Thinking Claude 2024-08-31

Key Takeaway

Thinking-Claude通过提示词让AI“假装思考”，展示思考过程，提升回答质量。
大模型的输出是一次性完成的，其“思考”是表演而非真正的反馈循环。
尽管是“表演”，但这种方式能强制模型产出更有逻辑、更全面的回答，具有实用价值。
文章通过苹果M芯片统一桌面端和移动端SoC的例子，展示了Thinking-Claude如何提供有价值的推演过程。
该项目通过浏览器插件和提示词设置实现，操作简单，值得尝试。

Full Content

最近有一个17岁的少年一夜爆火，名字叫涂津豪。他通过一套提示词，指导Claude如何进行更深入、更有条理的思考，希望最终能获得更高质量的回答。

不仅如此，涂津豪还做了一个浏览器插件，目的是为了提升可信度。因为装上之后，我们就能看到AI具体的思考过程。

在国内自媒体的带动下，不到24小时，小涂同学被捧上神座。甚至有人拿这个嘲讽OpenAI——既然靠提示词就能实现“慢思考”，那你们费了半天劲搞的o1模型，究竟是在搞什么？

说实话，刚看到这个项目的时候，我也挺吃惊的。因为根据我的经验，提示词工程并没有那么大的能耐，否则我们之前就没必要搞Multi-Agent去讨论和纠错了。但是，开始使用之后，似乎Claude又确实是先思考，然后才给出答案。

那么，问题出在哪儿？

其实，Thinking-Claude玩了一个“障眼法”——它让AI假装思考、表演思考。我们看到的思考过程，都是已经生成的，都是剧本。

哈喽大家好，欢迎来到我的频道。谦虚地说，我是国内少数几个能把关于AI的Why和How讲明白的博主。我提供的东西比教程更值钱。记得点一波关注。如果想链接我，就来newtype社群。已经有600位小伙伴付费加入啦！

回到今天的主题：Thinking-Claude。

我之所以说Thinking-Claude所带来的思考是假的、是一种表演，原因在于，大模型的输出都是一次性完成的。它被训练成了连续生成的模式，根据前一个token来预测下一个token。即使你强迫它在半途中暂停生成token，它也无法对已经生成的token做判断。因为它天生就没有这个机制，那又怎么可能靠你的几句提示词就开窍呢？

打个比方，大模型就像一个水龙头，一旦打开就会滔滔不绝地按照预设的路径流动。而这种机制是与思考相冲突的。

大家可以回想一下我们是怎么写作的。在整个写作过程中，我们会停下来，会回头修改，甚至还会推倒重来。这个就是在思考。这个就是思考的样子——它不是单线程，而是一个反馈循环的机制。

大模型没有这个机制，它只能一口气把答案全告诉你。要改进的话，得等下一轮对话。那现在它又被强制要求去思考，该怎么办呢？

它只能演给你看咯。就跟小朋友一样，表演给大人看。

大模型把自己的产出分成了两部分：一部分用来充当答案，一部分用来充当思考。

这个是技术、架构的局限性，光靠提示词是突破不了的。所以千万别觉得OpenAI是冤大头，白花那么多钱训练个o1出来，还比不过一个17岁的中学生。这些自媒体也太民间科学了。

但是，虽然思考是假的，虽然是在表演，我还是继续使用，并且我也推荐大家使用。因为，表演有表演的价值。

大家可以这么理解。在没有安装这个项目之前，Claude都是在即兴发挥。好在它底子好、演技强，不管怎么演都不太差。只是可能有的时候台词差点意思，毕竟是现喷的，没打磨过。

使用Thinking-Claude就好比是给Claude塞了个剧本，强制要求它按照本子演。所以，提升肯定是有的。只是有时候提升多一些，有时候提升少一些。

这就是我说“表演有表演的价值”的原因。在一个表演这个框架的约束下，强迫模型产出更有逻辑、更加全面的回答，何乐而不为呢？

而且，我其实挺喜欢它所表演的思考的，经常会给我启发，很有价值。

举个例子。我问Claude：为什么苹果需要通过M芯片统一桌面端和移动端设备的SoC？

如果直接看答案的话，是还不错啦，但是好像少了点什么。我们再来看它表演的思考。

在一开始，Claude认为这是一个技术问题。因为x86和ARM是两套完全不同的指令集架构，开发者需要维护两套代码，这就增加了大量的重复工作和成本。

我这边多科普两句。用大白话来说就是，要想让机器理解你的代码，你得做翻译，把你的代码翻译成机器能看得懂的语言。这个过程叫做“编译”，把源代码编译成特定架构的机器码。

x86和ARM对应两套完全不同的机器语言。这就意味着，开发者得做两次翻译，然后还得检查有没有问题，以及做必要的优化——这个真的是非常重的负担。所以，苹果要统一架构。

而且，一旦都改用自己的芯片之后，就不必跟英特尔商量着来了。苹果想怎么搞就怎么搞，都是自己的节奏。这种战略上的自由度是很诱人的。

紧接着，Claude的思考从战略角度延伸到了商业角度和用户体验角度。采用统一架构意味着处理器成本更低，利润空间提升，商业上有好处。并且iOS应用可以直接跑在Mac上，用户体验也提升。

整体来看，统一架构不只是一个技术选择，更是生态层面的战略决策。更加紧密、统一的生态系统，能让苹果在市场竞争和技术创新方面获得更大主导权。这就是苹果这种级别的公司会去做、也应该做的事儿。

你发现没有，Claude所表演的思考，其实给我们提供了一个推演的过程。我觉得这个价值不会比正式答案更低。

所以，大家能安装的都装上试试。过程很简单，就两个部分，有手就行。

第一，安装浏览器插件。

来到Thinking- Claude的GitHub页面，把整个项目的压缩包下载下来，并且解压缩。来到浏览器的插件管理页面，打开开发者模式，然后加载项目里的extention文件夹。

第二，设置提示词。

同样来到GitHub页面，进入这个文件，把里边所有内容都复制下来。接着来到Claude，新建或者打开一个Project。在右边可以添加提示词。把刚才复制的内容全部粘贴进去就搞定了。

可能是感受到了国内自媒体瞎吹捧的危险，在后来的更新中，涂津豪同学特意加了一段话，强调了Claude的能力都是Pre-designed，没法做到大幅提升。而这个项目只是为了向我们展示模型的“内心独白”。

OK，以上就是本期内容。想聊AI，就来我们newtype社群。那咱们下期见！