AI编程
Key Takeaway
- Replit Agent是一款激进的AI编程工具,能通过Agent完成环境设置、代码撰写和项目部署,实现云端开发。
- Replit Agent的模式类似于“厨师服务团队”,用户只需提供需求,Agent负责具体执行,适合快速原型开发。
- Replit Agent与Cursor等工具相比,更侧重于自动化,减少人工参与。
- Replit Agent支持H5页面等简单项目开发,但对于复杂项目仍有局限性。
- 文章强调AI编程工具能极大提升效率,但仍需用户具备开发思维,AI目前处于“遇强则强,遇弱则弱”的阶段。
Full Content
大模型火了快两年,没想到,第一个爆发的赛道是AI编程。
最近新出的Replit Agent特别激进。从环境设置、代码撰写到项目部署,它用Agent全部搞定。过程中,有时会询问你的意见,比如这个UI和你预期的样子是不是一样。其它时间Replit Agent都是在埋头干活。
整个开发是在云端完成的,用它的环境,这一点挺省心的。更重要的是,这意味着你随便用什么设备都可以,手机也OK。一旦有想法了,可以快速完成原型开发。然后把整个项目的压缩包下载下来,在本地做进一步处理。
Replit Agent的这种模式让我想起了农村的厨师服务团队,专门搞红白喜事的那种。厨师、厨具、餐具、桌椅,甚至食材和调料,他们全都提供。你就负责吃席就好。
相比之下,Cursor是一种人机Co-work的模式,还是需要人的大量参与。而再早之前的GitHub Copilot就更落后了,我觉得它只能算是一种智能代码补全。
为了测试,我拿Replit做了一个简单的H5页面。用户输入API Key之后,可以选择OpenAI的模型,然后对话。
需求给过去之后,Replit会先做分析,并且还会根据它的理解,给你一些选项,看你要不要也一并完善了。这一步其实是在做需求确认。大家如果服务过甲方就知道,如果需求对不清楚,那这项目大概率会很痛苦。
开工之后,Replit自动做环境的部署,把需要的包都下载、安装,然后编写代码、配置数据库等等。
因为项目比较简单,所以测试过程很顺利。调用OpenAI模型对话一次就成功了。剩下的都是小修小补,比如UI上删除一些不需要的元素,简单说一句就搞定。
Replit虽然不能说中文,但是你用中文它也能懂。不过我还是建议用英文,避免中文翻译成英文有歧义。四级水平的英文就足够和AI交流了,它都懂的。
到了部署环节,其实也没什么好调整的,Replit都帮你设置好了,直接点开始就OK。等进度条走到头,Replit会提供一个链接,那就是咱们的H5页面了。桌面端试了一下,完全正常。在手机上打开,也可以使用。
Replit支持Auto-scale,也就是说,如果访问量大的话,它会自动升级配置,保证项目的运行。在后台可以看到数据分析。如果你自己有域名的话,也可以在后台绑定域名。
看到这里你应该就明白,为什么我说Replit像农村的厨师服务团队了。不过,现在这个团队能力还不太行,搞些小活儿没问题,比如H5这种,碰上复杂点的项目就整不动了。
我在前一天让Replit做一个微信小程序,也是接OpenAI API的聊天机器人。整个过程就挺闹心的。Replit总让我帮它检查这、检查那的,甚至让我帮它看看Python文档有没问题——这谁给谁干活啊。到了部署环节,最后一步死活进行不下去,也找不出原因,然后就卡在这里了。
所以我估计,Replit至少还得花个半年时间去迭代吧。现阶段我就不订阅了,还是继续用Cursor比较靠谱。
给大家看看,我用Cursor把个人博客做出来了。我这些视频的文字稿,还有我日常的阅读清单,都会在博客上发布。后续我准备用Cursor做一个聊天机器人,用上RAG,把我的个人知识库接进去,开放给大家使用。
对于现在这些AI编程工具,我发现有两派观点:一派觉得这些工具都是垃圾,一派觉得这些工具可以替代程序员。这两派我都不赞成。我觉得现在的AI处于中间地带,没法替代,但是可以极大提升效率。如果你是纯小白,那真的很难,至少得具备开发思维。
就像我在上半年的一期视频里说的,AI在这个阶段的特征是八个字:
遇强则强,遇弱则弱。
AI没那么万能,现在只是Copilot,需要Pilot很强才能用起来。你要是没那么强,那就等着,等到普及的那一天,等到离AGI很近的那一天,跟着受益,也可以。
OK,以上就是本期内容。想找我就来newtype社群。那咱们下期见!
Key Takeaway
- Cursor是一款强大的AI编程IDE,能够原生支持AI功能,实现与AI的纯聊天式编程。
- 作者通过Cursor在10分钟内不写代码,仅通过与AI对话,开发出Chrome浏览器插件,展示了AI编程的高效性。
- Cursor的“Apply”功能能够自动定位代码修改位置,提升调试效率。
- AI编程工具的价值在于赋予用户不具备的新技能,而非仅仅替代现有工作。
- 文章强调AI能够将个体技能放大,创造更多价值,并展望了AI在产品开发中的广阔前景。
Full Content
三年之后,世界上最流行的编程语言是什么?
大概率不是Python、不是Java Script,而是英语。
最近在AI圈有一款IDE、编程软件超火,叫Cursor。你用过之后,估计也会有这样的想法。
我把Cursor看作是VS Code的终极进化版。它是VS Code的fork版本,各种功能基本一样,可以无缝导入过来。但是,在AI方面,Cursor就做得好多了。它不是像GitHub Copilot那样,以插件的形式植入进去,而是原生地、天然地支持——这一点非常重要,会带来质的不同。
在模型方面,Cursor很大方:你可以用它的模型,一个月订阅费用是20美金,也可以用你自己的模型,填入API Key就行。甚至,它还允许你用GitHub Copilot,不过它会提示你,不建议使用,因为性能上不如它的东西啦。
上个周末,我集中测试了一下Cursor。最好的一次,只花不到10分钟,不写任何一行代码,就是跟AI纯聊天,就开发出一个Chrome浏览器插件,能调用GPT去总结网页内容。
这10分钟的前3分钟,我用来写需求:
我希望开发一个浏览器插件,主要功能是用大模型总结网页。它会先做Scraping,也就是把网页内容都扒下来。然后把这些内容给到模型,按照Summary、Key Facts的格式输出。
在具体功能方面,插件上有三个按钮:Summarize就是总结。Settings就是设置,会要求用户输入OpenAI的API Key。插件先去确认这个Key是否可用。如果可以,就把可以使用的模型以列表都拉过来,让用户选择、保存。Clear就是清除上一次的总结结果,或者中断当前的总结任务。
当我在Word上把这些都写完之后,复制下来,打开Cursor,通过控制面板打开聊天界面,全部粘贴进去。接下来的体验跟咱们使用ChatGPT、Claude基本一样:
Cursor的反馈速度非常快,只用几秒钟就理解、拆解了需求。它告诉我们,要创建哪几个文件,每个文件的名称和代码都给到了。这时,我们只需要根据指示把文件创建好,把对应的文件开着,然后点击Apply,AI会把代码填进去。
Apply功能特别方便。因为在debug过程中,肯定要修改代码。Cursor不会把代码全部生成一遍——那就太慢、太消耗token了。所以,它只会输出需要修改的那几行。这时候,压力就给到用户这边了——因为要在几百行代码里边找到要修改的地方,还是挺费神的。所以,Apply功能会自动找到修改位置,用红色标注出原来的代码,用绿色标注出建议的代码,用户确认之后,它再自动替换。
等我们把所有代码都贴进文件里,就可以测试了。
打开Chrome浏览器的插件页面,进入开发者模式,打开代码所在的文件夹,就可以加载插件。
第一次测试肯定会有Bug。这边我们发现,Settings按钮没反应。很简单,回到Cursor里边,把问题告诉AI,然后把新生成的代码通过刚才说的Apply功能替换进去。
刷新插件,现在可以打开设置页面了。填入API Key,就像需求里说的那样,插件会先Verify一下,然后把Model List拉出来。这时会发现,List不全,只有两个模型,我猜是Cursor自作主张预设了,并没有真的去拉取。另外,点击Summarize并没有正常工作,只是显示了一个demo。
所以再次跟Cursor沟通,把这两个问题反馈了。像这样的debug过程会经常遇到。不过这一次挺幸运的,只来回处理了两趟。
再次刷新插件、重新测试。这下可以看到,模型列表正确显示出来了。点击Summarize,插件开始工作。等个几秒钟,成功总结出来了。为了确认真的可以用,我又找了两个网页,也都总结成功了。
我看了一眼时间,从写需求到测试成功,大概10分钟。这不是我第一次这么干。其实前一天也试过,不过不太成功,过程让我有点崩溃。
每一次修改代码都会带来新的Bug。我眼睁睁看着原本只有30行的代码膨胀了10倍,变成300多行,而且问题还没解决。
后来我心想,要不换个实现方式,改用多模态。先把整个页面截图下来,再给到GPT去识别和提取。结果还是不行。反正折腾了快一个小时。
到了第二天,我反思了一下。其实这个插件的工作流程就两步:先Scrape,再Summarize。之前我自己写Agent Workflow的时候就是这么处理的。于是我把需求改了一些,产品经理的活儿我干了,Cursor就专心Coding。果然,效果立竿见影。成功那一刻的快感,跟游戏通关差不多。
这款总结插件还很粗糙。如果要做到能上架的程度,可能还需要投入点时间:
第一,它的Scraping比较简单,还可以再强化,这样才能应对更多的网页。
第二,它的总结还不够好。这个调整起来很简单,不需要AI修改,我直接在提示词那边做详细要求就可以。
第三,现在只支持OpenAI,可以把Google、Anthropic等等都加上。
第四,把UI弄得好看一点。这个也简单。我找个别人的产品,截图下来给到AI,它肯定能照着做出来。
这四个要改进的地方,顺利的话,我估计再花个半小时应该能完成。全部搞定之后,就可以提交给Google审核、然后上架了。
我不喜欢说什么“未来已来”这种话,但是,Cursor给我的震撼是远超两年前的ChatGPT的。可能是因为,ChatGPT做的都是我会的东西,不就是生成一些文字嘛,而且还没我干得好。所以它带给我的只是一种新鲜和惊讶。
但是Cursor不一样。像开发一款浏览器插件这种事儿,我是完全不会,更别提在10分钟之内把原型搞定。所以这是一种震撼——它给了我完全不具备的新技能。我觉得,这个才是AI的真正价值。
今天很多人,尤其是国内的很多老板认为,AI就是用来降本,用来替代员工,成为裁员的借口。他们是把人力看做成本。他们眼中的世界是有限的,就这么点地方,所以得到处节省。
但其实,这个世界可以不是一个“有限游戏”,是可以变成“无限游戏”的。AI赋予个体从没有过的技能,或者把个体原有的技能放大好几倍。去满足更多,去创造更多,这不是更美好吗?
对我来说,如果要开发个小工具,可以在Cursor的帮助下直接完成。如果稍微复杂一点,那我也可以先做个原型出来,再花钱找前端和后端帮我完善。
突然感觉,我的整个世界变得好宽阔。也许到明年,我给到大家的,不只是这样的视频和文章,还有更多形态,可以是网页,可以是APP,甚至可以是一个小模型。我太期待了!
OK,以上就是本期内容。我要继续拉着Cursor做开发了。后续更多的发现,我会发在newtype社群里。还没加入的小伙伴抓紧吧,社群已经400多人了。今年肯定会到500人以上,明年争取突破1000。我那天想到一个Slogan很适合我这个频道以及社群,叫做“AI时代,摸着老黄过河”。好了,不扯了,咱们下期见!
Key Takeaway
- Claude Code被认为是地球上最强的AI编程工具,因为它与Claude模型深度适配和优化,且不计较上下文长度消耗。
/init
命令用于初始化项目,创建CLAUDE.md
文件,记录项目背景信息,提高效率和上下文一致性。- Plan Mode允许用户在执行复杂功能前,让Claude Code进行规划,尤其适用于不确定如何操作的场景。
/ide
命令支持Claude Code与VS Code、Cursor等IDE集成,提供更好的代码修改和提示体验。- 用户可以自定义命令,将常用操作(如解释代码)转化为快捷命令,提高工作效率。
/cost
命令用于查看API消耗,并可通过/model
命令切换模型以节省成本。- 作者强调,模型能力相同时,拥有更多工具的AI生产力更高,鼓励用户积极使用和探索MCP。
Full Content
地球上最好的AI编程工具,肯定是Claude Code。而且它接下来还会越来越好。
为什么它最强?我在社群里发过这么一段话:
如果把Claude模型比作引擎的话,那么,虽然各家公司都可以买到这个引擎,然后组装成赛车,但是只有Anthropic能发挥出它的究极实力。
大概率,Anthropic在训练Claude 4的时候,就已经把Claude Code内置的十几种工具给它用上了,对它做针对性的强化训练。
也就是说,这款引擎在研发阶段就已经跟底盘等等系统做适配、做优化了。它们就是最佳组合。其他厂商又怎么可能跟得上。
而且为了效果,Anthropic现在特别豪气,可以不计较上下文长度的消耗。相比之下,Cursor他们就得精打细算过日子,导致有时用户体验会很差。
Claude Code这么强,但是国内介绍得不多。原因很简单:中国的自媒体水平太差了。他们就只会喊“震惊”、“放大招”。碰上这种复杂的工具,还是命令行,而且还需要配置纯净的住宅IP,他们就不知道怎么下手了。
没有关系,我会出一系列视频深度介绍这款工具。今天先来五个非常实用的Tips,帮助大家用好Claude Code。
/init
当你开始一个新的项目,或者让Claude Code中途参与某个项目的时候,一定要先运行/init这条命令,也就是initialize,初始化。
这条命令最主要的作用,是创建一个CLAUDE.md文件。这个文件会包含项目所有的背景信息,包括:项目的核心概述和目标;重要的代码约定和风格指南;关键的文件和工具函数列表,等等。
有了这份文件,每次你启动Claude Code,它就会自动加载,这样它就明白整个项目的情况,不需要你重复说明。另外,当你的项目开发有了任何进展,也可以让Claude把进展写进这个文档。
所以,这行简单的命令,以及它生成的CLAUDE.md文件对于提高效率、保持上下文一致性非常重要。大家记得用起来。
Plan Mode
大部分情况下,我们都是让Claude Code在那边“自动驾驶”。但是,当有一些比较复杂的功能想要实现,或者我们自己也没想好究竟该怎么做的时候,可以切换到Plan Mode,让Claude Code先帮我们做好规划,然后再执行。
要切换到Plan Mode很简单,按快捷键shift加tab就行。比如,我想要提升高并发、服务器断连的应对能力。我自己想了一些解决方案,比如搞个API Key的备用池子等等。我把这些告诉Claude Code,让它帮我完整规划。
接到需求后,它会把需求有关的代码全部过一遍,然后给出非常详细的方案。如果觉得OK,可以让它照着开始执行。
说真的,这个模式挺好用的。当你拿不准的时候,记得让Claude帮你规划。
/ide
虽然Claude Code主要通过命令行界面,也就是CLI进行交互,在终端里运行,但是它也支持跟VS Code、Cursor集成,让用户在IDE的环境中获得更好的体验。
比如,集成之后,你可以看到文件中代码的改动,就像在Cursor里看到的一样。另外,当你选中几行代码之后,Claude Code那边也会有提示。
那么,要做到这一点,你需要做两件事,非常简单:
第一,安装Claude Code插件。这个搜一下就有,然后点击install安装。
第二,运行/ide命令,然后选择对应的IDE,比如我这边是Cursor。然后回车就搞定了。
Custom Command
Claude Code有很多现成的命令可以使用。除此之外,其实你也可以根据自己的需要去自定义命令。
Key Takeaway
- Kimi K2是月之暗面推出的开源大模型,其代码生成和Agentic能力表现出色,被认为是国产模型在AI编程和Agent产品领域的突破。
- Kimi K2的能力介于Claude 3.5和Claude 3.7之间,足以驱动Agent产品。
- 替换Claude Code模型有两种方法:最简单的是通过设置环境变量直接切换到Kimi K2 API;另一种是使用Claude Code Router项目,该项目支持多种模型服务商的API配置。
- AI编程工具由大模型(大脑)和编程助手(眼睛和手脚)两部分组成,大模型决定上限,编程助手提供工具操作能力。
- Kimi团队通过特定工作流激发了Kimi K2的工具使用能力,使其在预训练阶段就学会了如何使用工具。
Full Content
如果你用Claude Code有难度,那么,可以把模型换成Kimi K2,照样也能跑得起来。而且,效果可能会让你眼前一亮。
Kimi K2是月之暗面最新推出的模型,开源,1T参数。我最感兴趣的,是它的代码生成和Agentic能力。
说实话,对于国产模型来说,这两个能力,我一直没看到比较出众的。这也导致国产模型在AI编程、Agent产品这一波越来越落后。
直到Kimi K2的出现。
老外对这个模型的热度超过了国内用户。他们说,K2就是又一个“DeepSeek-R1时刻”。Kimi算法小哥的这篇博客也引起了老外极大兴趣。
我自己体验下来,感觉K2的能力大概介于Claude 3.5和Claude 3.7之间。用一句话总结就是:足以驱动Agent产品,能够拿来干活了。
你别觉得我评价低了。要知道,今天大部分Agent产品完全依赖Claude模型。Kimi能把国产模型在这一块的空白补上,是非常牛逼的!
哈喽各位好,欢迎回到我的频道。谦虚地说,我是国内少数几个能把关于AI的Why和How讲明白的博主。我提供的东西远比教程更值钱。记得点一波关注。如果想链接我,就来我们newtype社群。这个社群已经运营500天,有超过1500位小伙伴付费加入啦。
回到今天的主题:用Kimi K2驱动Claude Code。
要更换Claude Code的模型,网上有很多方法。我给大家介绍两个。先来一个对大多数人来说最简单的。
第一步,你去月之暗面官网注册账号,然后生成API Key。如果打算长期使用的话,可以充点钱。你看我就充了50块钱,属于Tier 1级别。Kimi的API费用很低,跟Claude比起来简直就是白菜价。大家可以大胆使用。
第二步,来到终端,运行这两行命令。它们的作用是设置环境变量,把模型的调用渠道切换到月之暗面那边。
设置完之后,输入claude,把Claude Code启动。这时模型就已经换成K2了。
第二个方法,略微折腾一点。不过好处是,可以更换各种模型。
Claude Code Router这个项目就是一个路由器,让你随意配置模型,以及做自定义设置。
它支持的模型服务商很多,包括OpenRouter、DeepSeek、Ollama、Gemini等等。Kimi官方的API也是支持的。
使用起来也挺简单的。运行这一行命令,把npm包安装好。然后打开config.json文件,像我这样配置Kimi官方的API。如果你不想填配置文件也OK,输入ccr start这行命令。按照它的要求,输入provider name、url、api key、model name,就可以完成配置。最后,输入ccr code,就可以正常使用了。
看到这里,可能有人会很奇怪:换了模型之后,Claude Code为什么还能用?
我打个简单粗暴的比方:阿姆罗能开高达,夏亚也可以开!只要Pilot够强,就都能驾驭。
我们使用的AI编程工具包含两个部分:大模型(LLM),和编程助手(Coding Assistant)。
编程除了需要脑子聪明,还需要很强的动手能力。比如要从那么复杂的代码库里找到需要的文件,或者就那么几行代码。