代码能力

严肃生产，还得看Claude 2024-08-31

Key Takeaway

Claude推出的Analysis tool（数据分析工具）能够帮助用户对数据表格进行分析和可视化呈现。
该工具基于Claude强大的代码能力和Artifacts功能，能够处理CSV文件并进行数据可视化。
AI在数据分析领域的应用，将像AI编程一样，赋能更多非专业人士。
Claude的数据分析能力使其在“严肃生产”场景中具有显著优势，可应用于市场营销、销售、IT等领域。
文章强调“严肃生产”是AI应用落地最有价值的场景。

Full Content

AI不只是要抢程序员的饭碗，现在连数据分析师也不放过。Claude前些天推出的Analysis tool特别好用。你手里如果有一份数据表格，想让AI帮你做些分析，并且可视化呈现，一定要试试这个功能。

目前这个分析工具还处于预览阶段，默认是没有打开的，就像最开始的Artifacts一样。所以需要咱们去Feature Preview选项里，把它勾选上，然后就开心使用啦。

对数据表格做分析，一直是很多人的刚需，但却是大模型的短板。像Claude之类的头部产品，虽说硬着头皮也能做，但它提供的结果是概括性的、比较宏观的，还做不到更加细致、精确的分析。这次新出的数据分析工具就补上了这个短板。它建立在两个基础上：

第一，代码能力。目前Claude的代码能力是全球公认最强的，没有之一。所以它可以直接使用JavaScript对用户上传的CSV文件进行读取、解析和重构，就像咱们人类数据分析师一样的处理方式。而且在处理的过程中如果遇到什么错误的话，它还会自己修复。

第二，Artifacts功能。对Claude以及所有Chatbot来说，Artifacts都是一个非常重要的创新。它在主对话窗口之外单开了一个专用窗口。所有根据用户请求而生成的内容都在专用窗口里显示。为了确保安全性，它还采用了类似沙盒的技术，创建了一个安全游乐场。

所以，Claude能在数据分析上取得惊艳的效果，全都来自于基础能力的遥遥领先。

哈喽大家好，欢迎来到我的频道。谦虚地说，我是国内少数几个能把关于AI的Why和How讲明白的博主。记得点一波关注。只要有一个视频你看进去了，就赚大了。如果想链接我，就来newtype社群。已经有600位小伙伴付费加入啦！

回到今天的主题：Claude Analysis tool。

之前我在社群里说过，AI的价值不只是降低成本、给老板一个压榨员工的理由，更重要的是带来了新的能力。AI编程的价值很多人已经享受到了。接下来，数据分析也会像编程一样，通过AI下放给更多人。从这一点来看，Claude真的是功德无量。

为了给大家演示新的数据分析功能，我下载了一份比特币的历史数据，包括价格、交易量等等。格式好像有点小问题，我没细看。反正直接拖进对话框，都让AI处理就好。

接到需求之后，Claude会先对数据进行处理，然后再启动Artifacts功能，通过代码创建一个可视化的展示。

大家之前可能只接触过用Excel做数据分析。但是Excel只能搞定一些简单的活儿。如果比较专业的话，就会用到Python，它的pandas、numpy都是非常流行的数据分析库，它俩各有所长。如果涉及到统计学的话，还有R语言。它的学习曲线比Python陡峭多了。当然啦，无论是哪一个，对咱们来说，想要掌握都不是一天两天的事儿。这就是AI的价值所在。

回到Claude这边。可以看到，它已经做完可视化呈现了，通过数据还原出价格走势图。不仅如此，它还主动做了一些初步总结，发现比特币波动性大，目前处于上升态势，而且价格处于历史高位区间。

大家注意看，在稍微停顿了一下之后，Claude还给出三个建议的问题。这个设计显然是为了引导普通用户继续往下分析。不然很多人看到这一大堆东西就懵逼了。那咱们就让AI继续创建一个互动式的价格走势图。

可能是这个功能还处于预览阶段的原因，会有一些报错。不过没关系，咱们让Claude自己修复就好。或者，如果有什么不满意的地方，也可以直接提。比如，我希望它尽可能把时间周期拉长。于是Claude就会返回去查看数据，然后调整代码，最终展示更长时间周期的分析。

Claude这些报错都是小问题。现阶段，我觉得有两个最需要改进的地方：一是Rate Limit，目前太低了，一下就用没了，希望官方能尽快调高一些。二是刚才提到的建议问题，问得太水了，起不到引导的作用。

通过刚才这段演示，大家可以看到，Claude的理解范围已经从之前的文字扩展到了数据。在文字方面，我之前做过对比，Claude的逻辑性显著强于ChatGPT。现在又把对数据的精确分析给加上了。这样一来，Claude就牢牢占据了严肃生产这个场景。

如果你做市场营销的，可以上传客户互动数据；如果你是做销售的，可以上传各个销售大区的业绩；如果你是搞IT的，可以上传服务器日志。这些Claude都能处理，都能帮到你。这个可比帮小白领写一段小红书文案，或者想一句品牌Slogan要值钱多了。

我认为，严肃生产一定是AI应用落地最有价值的场景，也是现在大部分AI厂商都忽视的。

OK，以上就是本期内容。想链接我，就来newtype社群。那咱们下期见！

写不好代码的模型，没有未来 2024-08-31

Key Takeaway

写代码的能力是衡量大模型优劣和决定其未来的核心标准。
代码能力强的模型智商更高，因为它要求逻辑、精确性和对复杂系统的理解。
编程是模型的“复合动作”，能扩展其能力边界，使其泛化到更多领域，是通往AGI的必经之路。
代码能力强的模型拥有更发达的“小脑”，能将抽象意图转化为具体行动，实现与数字世界的交互。
AI编程市场潜力巨大，能优化开发者成本和重构软件生产方式，具有巨大的商业价值。

Full Content

想知道哪个大模型能活到最后？一个标准：写代码的能力。

写不好代码的模型，没有未来。写不好代码的模型，你就不需要再关注了。

这个观点，我前几天在社群内说过。当时是回答一个小伙伴的提问。我知道它看起来很极端、很偏见。但是，这个在圈内已经共识了。不信的话，我给你四个理由。

第一，代码写得越好，模型智商越高。

跟写文章不一样，写代码要求绝对的逻辑、精确的语法和对复杂系统的理解。

自然语言其实有很大的模糊性——一篇文章，怎么写都行，都可以写得很好。而且有很多捷径，比如模仿。咱们小时候都背过很多范文，对吧？

但是代码不同。它是零容错的——一个符号错了，程序就挂了。它还要求逻辑一致，因为每行代码都是系统的一部分。最后，它还是高度抽象的——它是从具体问题抽象出算法，再具体转化成为可执行的代码。

所以，一个能写出优秀代码的模型，它的“智力”肯定不只是是模仿，而是真正理解了抽象概念和规则。

这就是为什么我一直推荐Claude和Gemini的原因。即使你不编程，我也建议你这两款模型二选一，甚至都要。

第二，代码写得越好，模型的能力圈越大。

打个比方，你想通过健身获得一副好身体，那么肯定不能只练局部，而是全都要练，包括深蹲、硬拉、卧推、有氧，以及拉伸。

对模型来说，编程就是这样一个完美的“复合动作”。它不仅仅是单一技能，而是强迫模型同时发展和整合一系列的认知能力。

一旦这些底层能力被锻炼得足够强大，它们就可以被用来处理更多复杂任务。比如，可以被泛化、被应用到法律、金融、科研等领域。

于是，模型的能力边界扩展了。当这个边界扩展到各个方面，AGI就实现了。

第三，代码写得越好，模型的小脑越发达。

今天的模型跟两年前的模型很不一样。

在我看来，两年前的模型更多是一个被动的文本生成器，能够用自然语言对话。但是，它被“锁”在了文本的世界。

而今天的顶级模型，它拥有了代码能力。于是它可以执行一个简单的脚本来分析数据，可以调用复杂的API来控制一个应用程序，等等。

也就是说，它除了具备很强大的大脑之外，还有很发达的小脑，可以把抽象的意图转化成与数字世界交互的具体动作。

而那些代码能力弱的模型，就好比一个只有大脑但小脑发育不全的人。它可能“知道”该做什么，但无法精确控制自己的“肢体”，动作非常笨拙。

这就是为什么所有顶尖的AI公司都在疯狂提升模型的代码能力。他们不仅仅是在教模型“编程”，更是在训练模型的“小脑”，赋予它在数字世界中自由行动的核心能力。

这是通往AGI的必经之路。

第四，代码写得越好，模型越值钱。

这个很简单，咱们来算两笔账。

全球大约有3000万开发者。每人每年的综合成本，包括薪资、福利、设备等等，咱们按10万美元来计算。那么，整个市场的人力成本就是一年3万亿美元。

咱们不说完全替代，就优化个20%，那就是每年6000亿美元。

这还不是最大的市场。全球企业每年在软件和IT服务上的支出已经达到5万亿美元。想象一下，如果软件的生产、维护、迭代方式被AI根本性地重构，那么，这个市场值多少钱？

这就是为什么像Cursor之类的公司估值能飙升那么快的原因。

总结一下，代码写得越好，模型智商越高，能力圈越大，小脑越发达，赚钱能力越强。这些综合起来，不就意味着一个光明的前景吗？

你拿代码能力这个标准去看市面上的模型，去看中国的模型，你心里就有谱了。

OK，以上就是本期内容。想了解AI，想成为超级个体，想找到志同道合的人，就来我们newtype社群。那咱们下期见！