生产力工具

Raycast + MCP = AI Mac

Key Takeaway

  • Raycast通过集成AI插件和MCP(模型控制协议),实现了Mac上的AI功能,打造“AI Mac”体验。
  • Raycast作为Mac效率中心,能实现跨应用调度,通过自然语言交互控制软件。
  • Raycast简化了MCP的部署和配置,用户可轻松安装和使用官方提供的MCP服务器。
  • MCP使得模型能够与外部工具无缝集成,提升了AI应用的实用性和便捷性。
  • 文章强调了Raycast在AI Chat、知识库辅助写作等方面的应用,并认为其是AI终端的理想形态。

Full Content

想体验AI Mac,装上Raycast就好。

Raycast不只是Mac的效率中心。添加AI插件之后,就可以实现跨应用调度。我在之前的视频里是这么说的:

一个AI枢纽去无缝集成所有软件,然后在一个界面上完成所有交互,这个就是我想要的AI PC、AI Mac的功能和体验。

现在,这个我最喜欢的Mac软件支持MCP了。你看,我跟GPT-4o mini说:打开Safari页面,进入苹果官网。通过MCP,模型很顺利就完成了任务。

模型加上MCP,就是Agent。一台终端无缝集成了模型和MCP,就成为软硬一体的Agent。这个就是我特别喜欢、特别关注Raycast的原因。

哈喽各位好,欢迎回到我的频道。谦虚地说,我是国内少数几个能把关于AI的Why和How讲明白的博主。我提供的东西远比教程更值钱。记得点一波关注。如果想链接我,就来我们newtype社群。已经有1000多位小伙伴付费加入啦。

回到今天的主题:Raycast MCP。

MCP出来这么久,一直有一个难题:用户部署、配置难。

作为用户,你不仅要知道去哪里找MCP服务器,还得懂得那些配置参数是什么意思。Raycast在这方面做得很棒。我给你们演示一下。

在使用MCP之前,你先安装这个插件。把Raycast唤出来,输入Store,然后搜索MCP就可以看到插件。

安装之后,搜索MCP,会看到Manage、Install、Search、Import四个选项。别管其它的,你就选择Search MCP,因为官方已经准备了一堆常用的MCP服务器。

比如,咱们选择Playwright。进去之后会看到,命令和参数已经填好了,只需要点击安装就可以搞定。

当然,Playwright是不需要填写环境变量的MCP。咱们经常会遇到像Tavily之类的,就需要填写API Key,那就把Key粘贴进去,别的不用管,安装就行。

这个是接近自动部署的方法。如果官方提供的MCP里没有自己想用的,怎么办?那就手动安装。

输入Install MCP,就能看到熟悉的界面。按照GitHub上的介绍,把命令、参数和环境变量填进来就行。其中,多个参数之间用空格隔开。

所有安装好的MCP都在Manage MCP里。选中任意一个都可以进行编辑。那么,有了MCP之后,怎么在Raycast中使用呢?

很简单,打开AI Chat。选择一个支持AI插件的模型,比如GPT-4o mini。然后在下边的添加AI插件选项中搜索名字,把MCP挂上去就可以了。

所以,我现在使用的支持MCP的客户端有两个:

一个是Raycast的AI Chat,用来快问快答。为此我还特意在Stream Deck上加了一个快捷键。因为常用的快捷键都占满了,所以分配了一个比较奇怪、不太好按的键位给AI Chat,然后放到Stream Deck里,这样就完美解决了。

另一个是Cursor。因为我添加了知识库的MCP,再加上Cursor有很强的文档编辑能力,所以需要AI辅助写作的时候,我都用Cursor。

至于ChatWise,就只能作为备用了。你看我现在的AI工具都在Stream Deck上了:涉及到MCP的话,有刚才说的那两个;不需要MCP的话,Gemini、Grok、NotebookLM足以满足。所以像这种客户端,差异化得做得足够强,不然打开率真的会很低。

OK,以上就是本期内容。想了解AI,想成为超级个体,想找到志同道合的人,就来我们newtype社群。那咱们下期见!

五款实用MCP推荐

Key Takeaway

  • MCP(模型控制协议)是提升AI生产力的关键,本文推荐五款实用MCP。
  • Tavily和Sequential Thinking组合:Tavily解决信息获取,Sequential Thinking增强模型多步骤推理能力,提升回答质量。
  • Filesystem和Markitdown组合:Filesystem允许模型访问本地文件,Markitdown将PDF转换为Markdown,使模型能处理PDF文档。
  • 向量数据库MCP(Milvus/Pinecone):用于接入个人笔记信息,实现本地或云端知识库的存储和检索。
  • 这些MCP都围绕信息展开,旨在让模型获取更多信息并提升信息处理能力,使AI从“缸中之脑”变为更完整的工具。

Full Content

MCP火这么久了,有哪些是日常当中经常会用到的,真的能提升生产力的?

本期视频我会介绍五个我基本上每天都会用的MCP。看起来特别朴实无华、没什么节目效果,但它们就是好用。

这些MCP,以及更多AI工具,我平时都会在社群内分享。想提升AI生产力的小伙伴记得加入。

那咱们先从前两个MCP开始,它们是一对组合。

Tavily是我用了很久的、专门为大模型优化过的搜索引擎。它的MCP里包含了搜索和提取两个工具,特别实用。但是,如果你只用这一个MCP,虽然可以联网搜索,但答案不会太好。

比如,我提了一个问题:皇马在本赛季为什么表现不好?详细分析。

Claude使用Tavily找了一堆网页,似乎回答了我的提问。但咱们来仔细看,它所谓的详细分析,说什么“比赛成绩不稳定”、“欧冠表现不佳”,这都是现象,不是原因,根本不叫“详细分析”。

你看,作为模型,Claude 3.7 Sonnet够强了吧?结果,给出的答案却这么水。

这个时候,就需要Sequential Thinking这个MCP。它的作用就是让模型进行多步骤推理。加上之后,效果非常明显。

还是同样的问题,详细分析皇马本赛季的原因。我特意要求使用Sequential Thinking和Tavily这一对组合。

开始都一样,就是搜集资料。但在此之后,Claude调用了七次Sequential Thinking。

展开之后可以看到,有了这个MCP,模型的逻辑明显变强了。Claude把皇马的问题提炼了出来,包括伤病、疲劳、训练方式和体能管理等等。再看正式的答案,明显比刚才的靠谱多了,对吧?

这一对组合,Tavily解决信息的问题,Sequential Thinking解决逻辑的问题。这两个都是很基础、很重要的能力,一定要给模型加上。

OK,咱们再来看接下来的两个MCP,也是一对组合。

Filesystem能让模型接入指定的文件夹,比如桌面,去读取桌面上的文件,以及创建新的文件。

像Cursor之类的客户端,因为它是拿来编程用的,所以天然就具备很强的文件读取和编辑能力。但是,像ChatWise这种客户端就难搞了。所以需要Filesystem。至于安全问题,大家可以放心:文件夹都由咱们来指定,不用担心模型会乱来。

跟Filesystem搭配的MCP是Markitdown。这是微软之前出的工具,能够将PDF转成Markdown格式。现在出了MCP之后,模型终于可以处理PDF这种文档了。

我个人对PDF是深恶痛绝的。从技术角度看,这种格式都快接近图片了,搞起来太费劲。PDF在AI时代就应该被完全淘汰。

那么,Filesystem加上Markitdown,能怎么用呢?

比如,我在桌面上有一个PDF文档,是特别有名的《Bitter Lesson》。如果我想把它转成Markdown格式的话,现在可以直接跟模型说。它会先用Filesystem确认能不能访问桌面。然后用Markitdown做转换。最后再用Filesystem在桌面创建新文件,把提取出来的内容写进去。

或者,我也可以直接让模型帮我总结。

你看,我跟模型说,帮我读取并总结桌面上的PDF文档。它马上就知道,要用Filesystem和Markitdown进行读取和提取,然后就可以总结了。

Claude上下文窗口不大,处理这种只有两页的PDF是OK。如果碰上那种十几页的,最好还是换成Gemini系列。

刚才介绍的两组MCP,前一组用来处理网页信息,后一组用来处理文档信息。那么,自己的笔记信息怎么通过MCP给到模型呢?

如果你像我一样用本地向量数据库的话,可以选择Milvus。这个数据库支持存储和检索。部署好之后,OrbStack一直挂着运行。然后不管你用哪个客户端,都可以随时通过MCP获取数据。

关于Milvus的部署,我前两天出了一期社群专属视频,把要点都一一介绍了。已经加入社群的小伙伴记得看。

如果你想用云端向量数据库的话,可以选择Pinecone。它同样也有MCP。如果你动手能力再强一些的话,可以使用AWS,这个就更强力了。之后我也会出社群专属视频详细介绍。

所以,这五个就是我每天都在使用的MCP。你发现没有,它们都围绕信息展开——让模型获取更多信息,让模型处理信息的能力提升。有了这些工具,模型就不再是缸中之脑。

OK,以上就是本期内容。想了解AI,想成为超级个体,想找到志同道合的人,就来我们newtype社群。那咱们下期见!

有了MCP,AI才完整

Key Takeaway

  • MCP(模型控制协议)是AI发展的关键,它将AI从“功能机”进化到“智能机”,解决了传统API接口不统一和不理解语义的问题。
  • MCP为AI提供统一的工具接口,使其能够自由接入和控制海量工具,实现更进阶的任务。
  • 文章通过演示AI工具(Cline)如何通过MCP调用Obsidian(笔记)和Tavily(搜索)等多个工具,展示了MCP的实际应用。
  • MCP将用户的查询、工具描述和参数结构化传递给大模型,由大模型决定如何处理。
  • Claude桌面版和Cline是目前对MCP支持最好的工具,用户也可以自行开发MCP工具。

Full Content

如果你关注AI、关注Agent,那么你一定要关注MCP,一定好好理解它,一定要多用它。

AI的发展有两条非常明确的路线,我之前在社群里说过:一是掌握更多信息,二是控制更多工具。

两年前的大模型,它的信息来源只有训练时的数据,以及推理时我们告诉它的东西。

后来,我们给它加上联网搜索,让它能获得更广阔、更及时的信息;我们给它加上RAG技术、加上知识库,让它能获得垂直领域那些不外传的信息。

这些还不够,因为都是文字信息。于是我们又上了多模态,现在连图片它都能理解了。

你看,所有这些发展都符合第一条路线——掌握更多信息。

光有信息还不够,要改变世界,你手里还得有工具。这个就是第二条路线。我认为,MCP是第二条路线的关键。

有了MCP,你手里的AI就从功能机进化到智能机。

老规矩,我先演示,再解释。

屏幕左边是Obsidian,一个笔记应用。为了演示,我新建了一个库,放了三篇之前的视频脚本作为笔记。

屏幕右边是Cline。它是一个AI插件,编程能力非常强。如果你的主力是VS Code,那一定要用它。

那么,我想给大家看的是,通过Obsidian MCP——你可以简单理解为就是一个接口,像Cline这类AI工具可以直接读取和修改Obsidian里的笔记。

咱们先从最简单的开始。我问Cline:库里都有哪些笔记?

接到请求后,Cline看了一圈环境,发现Obsidian跟一个MCP服务器连在一起。于是,它决定通过MCP服务器,调用list notes这个工具,去查询都有哪些笔记。

在RESPONSE里边,MCP服务器把查询到的信息返回给了Cline,然后它给出最终答案。

跟查询库里都有哪些笔记一样的原理,Cline还可以通过MCP服务器读取笔记的具体内容。

我问它,这篇笔记的主要内容是什么?

这时,Cline会使用read note工具去读取笔记。把一千多字的内容全部提取之后,它对内容进行总结,然后给出最终答案。

大家如果有印象的话,应该记得我之前出过两期视频,都是关于Cursor对Obsidian笔记的修改。这个做法的前提是,Cursor打开了Obsidian存放在本地的笔记仓库。

但是,并不是所有AI工具都有这样的条件和能力去调用整个笔记仓库。这时候就需要MCP服务器,它作为一个通用接口连接两端。

我刚才演示的,只连接了一个MCP服务器。其实,为了完成一项任务,AI可以连接多个MCP服务器,调用多个工具。我再演示一个例子。

这是OpenAI官网的文章,关于GPT-4.5。我把链接给到Cline,希望它能把文章的内容给扒下来。

这时,Cline发现,还有Tavily MCP可以连接。Tavily是一个专门为大模型优化过的搜索引擎。它的MCP里边有一个提取网页内容的工具。

使用这个工具,Cline顺利把网页内容给扒了下来。然后,它重新整理和总结所有信息,最终给出很清晰的回答。

接着,我给出第二条指令:把这份Summary作为新笔记,存进Obsidian里边。

你看,它调用Obsidian MCP里的create note工具,开始创建笔记。中间遇到了一个格式上的问题,主要是特殊字符导致解析错误。我猜是中文标点的问题。好在Cline很聪明,在第二次尝试的时候,主动规避了特殊字符,最后完成了笔记创建。

通过刚才的演示可以看到,像Cline、Claude之类的AI应用,能够调用各种工具,完成更进阶的任务。这个就是MCP的价值。

这么说吧:MCP就是AI的USB-C接口。

在MCP出来之前,AI都是怎么调用工具的?通过API接口对吧?但是,API有很大的局限性,不适合AI。

第一,不同工具的API都有各自的规范。

举个例子。如果要调用一个天气预报工具,我就得按它的格式要求告诉它城市名称和日期,比如单词“Beijing”、“0315”(也就是3月15日)。如果要调用一个计算器工具,我就得按它的格式要求告诉它数值和符号,比如“1”、“+”、“2”。

市面上有海量的工具。AI要知道、要去满足每一个工具的要求,这是不现实的。这就好比有的设备是USB-A接口,有的设备是micro USB,有的设备是mini USB。作为用户,看到这一堆接口,头都大了好吗!

所以,AI需要一套统一的规范,去统一所有的工具接口。就好比今天的USB-C,手机也好、电脑也好,全都用这个接口。而且,现在新的显示器还支持用USB-C接MacBook,既能充电,还能传输信号,连HDMI都省了。一根线走天下是大势所趋。

第二,API关注的是数据的传输,而非数据的含义。

就像刚才的例子,我如果问:下周一北京天气怎么样?或者,一加二等于几?像这样的数据,API没法接受,因为它不理解、也不需要理解这是什么意思。它的职责就是把数据拿过来、传过去。

但是MCP能理解。

其实也不是MCP理解的,而是它把一切都打包好,给到大模型去理解。MCP把用户的查询、工具的描述和参数,以结构化的方式传递给大模型,由大模型决定如何处理。

目前市面上对MCP支持最好的工具,一个是Claude桌面版——毕竟MCP就是他们家提出的,另一个是Cline。

我刚才演示里的两个MCP,Tavily那个是现成的,可以在Cline Marketplace里搜到。然后Cline会下载代码仓库,并且自动部署,非常方便。

而Obsidian那个,是我让Cline自动生成。过程中我没写一行代码,就是一路点“同意”,几分钟就搞定了。如果需要增加或者修改某个工具,也可以交给Cline去完成。

MCP本身并不复杂。在AI编程工具的帮助下,你也可以开发自己的MCP工具,然后部署在本地或者云端,比如Cloudflare。最核心的index文档,你完全可以在AI的帮助下理解清楚。

或者,你就用现成的。市面上已经出现好多个MCP导航网站,比如Smithery。

在商业化方面,我看到市场上也出现了第一款收费的MCP,可以帮忙设计UI。

MCP的价值得到越来越多人的认可。一切都在快速推进中。就像前边说的,如果AI只能调用有限的、预先设置好的工具的话,那不就是以前的功能机吗?通过MCP,AI可以自由接入海量工具。从这一刻开始,AI才从功能机时代迈入智能机时代。