代码能力

严肃生产,还得看Claude

Key Takeaway

  • Claude推出的Analysis tool(数据分析工具)能够帮助用户对数据表格进行分析和可视化呈现。
  • 该工具基于Claude强大的代码能力和Artifacts功能,能够处理CSV文件并进行数据可视化。
  • AI在数据分析领域的应用,将像AI编程一样,赋能更多非专业人士。
  • Claude的数据分析能力使其在“严肃生产”场景中具有显著优势,可应用于市场营销、销售、IT等领域。
  • 文章强调“严肃生产”是AI应用落地最有价值的场景。

Full Content

AI不只是要抢程序员的饭碗,现在连数据分析师也不放过。Claude前些天推出的Analysis tool特别好用。你手里如果有一份数据表格,想让AI帮你做些分析,并且可视化呈现,一定要试试这个功能。

目前这个分析工具还处于预览阶段,默认是没有打开的,就像最开始的Artifacts一样。所以需要咱们去Feature Preview选项里,把它勾选上,然后就开心使用啦。

对数据表格做分析,一直是很多人的刚需,但却是大模型的短板。像Claude之类的头部产品,虽说硬着头皮也能做,但它提供的结果是概括性的、比较宏观的,还做不到更加细致、精确的分析。这次新出的数据分析工具就补上了这个短板。它建立在两个基础上:

第一,代码能力。目前Claude的代码能力是全球公认最强的,没有之一。所以它可以直接使用JavaScript对用户上传的CSV文件进行读取、解析和重构,就像咱们人类数据分析师一样的处理方式。而且在处理的过程中如果遇到什么错误的话,它还会自己修复。

第二,Artifacts功能。对Claude以及所有Chatbot来说,Artifacts都是一个非常重要的创新。它在主对话窗口之外单开了一个专用窗口。所有根据用户请求而生成的内容都在专用窗口里显示。为了确保安全性,它还采用了类似沙盒的技术,创建了一个安全游乐场。

所以,Claude能在数据分析上取得惊艳的效果,全都来自于基础能力的遥遥领先。

哈喽大家好,欢迎来到我的频道。谦虚地说,我是国内少数几个能把关于AI的Why和How讲明白的博主。记得点一波关注。只要有一个视频你看进去了,就赚大了。如果想链接我,就来newtype社群。已经有600位小伙伴付费加入啦!

回到今天的主题:Claude Analysis tool。

之前我在社群里说过,AI的价值不只是降低成本、给老板一个压榨员工的理由,更重要的是带来了新的能力。AI编程的价值很多人已经享受到了。接下来,数据分析也会像编程一样,通过AI下放给更多人。从这一点来看,Claude真的是功德无量。

为了给大家演示新的数据分析功能,我下载了一份比特币的历史数据,包括价格、交易量等等。格式好像有点小问题,我没细看。反正直接拖进对话框,都让AI处理就好。

接到需求之后,Claude会先对数据进行处理,然后再启动Artifacts功能,通过代码创建一个可视化的展示。

大家之前可能只接触过用Excel做数据分析。但是Excel只能搞定一些简单的活儿。如果比较专业的话,就会用到Python,它的pandas、numpy都是非常流行的数据分析库,它俩各有所长。如果涉及到统计学的话,还有R语言。它的学习曲线比Python陡峭多了。当然啦,无论是哪一个,对咱们来说,想要掌握都不是一天两天的事儿。这就是AI的价值所在。

回到Claude这边。可以看到,它已经做完可视化呈现了,通过数据还原出价格走势图。不仅如此,它还主动做了一些初步总结,发现比特币波动性大,目前处于上升态势,而且价格处于历史高位区间。

大家注意看,在稍微停顿了一下之后,Claude还给出三个建议的问题。这个设计显然是为了引导普通用户继续往下分析。不然很多人看到这一大堆东西就懵逼了。那咱们就让AI继续创建一个互动式的价格走势图。

可能是这个功能还处于预览阶段的原因,会有一些报错。不过没关系,咱们让Claude自己修复就好。或者,如果有什么不满意的地方,也可以直接提。比如,我希望它尽可能把时间周期拉长。于是Claude就会返回去查看数据,然后调整代码,最终展示更长时间周期的分析。

Claude这些报错都是小问题。现阶段,我觉得有两个最需要改进的地方:一是Rate Limit,目前太低了,一下就用没了,希望官方能尽快调高一些。二是刚才提到的建议问题,问得太水了,起不到引导的作用。

通过刚才这段演示,大家可以看到,Claude的理解范围已经从之前的文字扩展到了数据。在文字方面,我之前做过对比,Claude的逻辑性显著强于ChatGPT。现在又把对数据的精确分析给加上了。这样一来,Claude就牢牢占据了严肃生产这个场景。

如果你做市场营销的,可以上传客户互动数据;如果你是做销售的,可以上传各个销售大区的业绩;如果你是搞IT的,可以上传服务器日志。这些Claude都能处理,都能帮到你。这个可比帮小白领写一段小红书文案,或者想一句品牌Slogan要值钱多了。

我认为,严肃生产一定是AI应用落地最有价值的场景,也是现在大部分AI厂商都忽视的。

OK,以上就是本期内容。想链接我,就来newtype社群。那咱们下期见!

写不好代码的模型,没有未来

Key Takeaway

  • 写代码的能力是衡量大模型优劣和决定其未来的核心标准。
  • 代码能力强的模型智商更高,因为它要求逻辑、精确性和对复杂系统的理解。
  • 编程是模型的“复合动作”,能扩展其能力边界,使其泛化到更多领域,是通往AGI的必经之路。
  • 代码能力强的模型拥有更发达的“小脑”,能将抽象意图转化为具体行动,实现与数字世界的交互。
  • AI编程市场潜力巨大,能优化开发者成本和重构软件生产方式,具有巨大的商业价值。

Full Content

想知道哪个大模型能活到最后?一个标准:写代码的能力。

写不好代码的模型,没有未来。写不好代码的模型,你就不需要再关注了。

这个观点,我前几天在社群内说过。当时是回答一个小伙伴的提问。我知道它看起来很极端、很偏见。但是,这个在圈内已经共识了。不信的话,我给你四个理由。

第一,代码写得越好,模型智商越高。

跟写文章不一样,写代码要求绝对的逻辑、精确的语法和对复杂系统的理解。

自然语言其实有很大的模糊性——一篇文章,怎么写都行,都可以写得很好。而且有很多捷径,比如模仿。咱们小时候都背过很多范文,对吧?

但是代码不同。它是零容错的——一个符号错了,程序就挂了。它还要求逻辑一致,因为每行代码都是系统的一部分。最后,它还是高度抽象的——它是从具体问题抽象出算法,再具体转化成为可执行的代码。

所以,一个能写出优秀代码的模型,它的“智力”肯定不只是是模仿,而是真正理解了抽象概念和规则。

这就是为什么我一直推荐Claude和Gemini的原因。即使你不编程,我也建议你这两款模型二选一,甚至都要。

第二,代码写得越好,模型的能力圈越大。

打个比方,你想通过健身获得一副好身体,那么肯定不能只练局部,而是全都要练,包括深蹲、硬拉、卧推、有氧,以及拉伸。

对模型来说,编程就是这样一个完美的“复合动作”。它不仅仅是单一技能,而是强迫模型同时发展和整合一系列的认知能力。

一旦这些底层能力被锻炼得足够强大,它们就可以被用来处理更多复杂任务。比如,可以被泛化、被应用到法律、金融、科研等领域。

于是,模型的能力边界扩展了。当这个边界扩展到各个方面,AGI就实现了。

第三,代码写得越好,模型的小脑越发达。

今天的模型跟两年前的模型很不一样。

在我看来,两年前的模型更多是一个被动的文本生成器,能够用自然语言对话。但是,它被“锁”在了文本的世界。

而今天的顶级模型,它拥有了代码能力。于是它可以执行一个简单的脚本来分析数据,可以调用复杂的API来控制一个应用程序,等等。

也就是说,它除了具备很强大的大脑之外,还有很发达的小脑,可以把抽象的意图转化成与数字世界交互的具体动作。

而那些代码能力弱的模型,就好比一个只有大脑但小脑发育不全的人。它可能“知道”该做什么,但无法精确控制自己的“肢体”,动作非常笨拙。

这就是为什么所有顶尖的AI公司都在疯狂提升模型的代码能力。他们不仅仅是在教模型“编程”,更是在训练模型的“小脑”,赋予它在数字世界中自由行动的核心能力。

这是通往AGI的必经之路。

第四,代码写得越好,模型越值钱。

这个很简单,咱们来算两笔账。

全球大约有3000万开发者。每人每年的综合成本,包括薪资、福利、设备等等,咱们按10万美元来计算。那么,整个市场的人力成本就是一年3万亿美元。

咱们不说完全替代,就优化个20%,那就是每年6000亿美元。

这还不是最大的市场。全球企业每年在软件和IT服务上的支出已经达到5万亿美元。想象一下,如果软件的生产、维护、迭代方式被AI根本性地重构,那么,这个市场值多少钱?

这就是为什么像Cursor之类的公司估值能飙升那么快的原因。

总结一下,代码写得越好,模型智商越高,能力圈越大,小脑越发达,赚钱能力越强。这些综合起来,不就意味着一个光明的前景吗?

你拿代码能力这个标准去看市面上的模型,去看中国的模型,你心里就有谱了。

OK,以上就是本期内容。想了解AI,想成为超级个体,想找到志同道合的人,就来我们newtype社群。那咱们下期见!