GoogleIO

Google:王者归来

Key Takeaway

  • Google通过克制赚钱欲望,推出搜索的AI模式,展现了其AI First的战略决心。
  • Google在AI领域实现了“王者归来”,其全栈式AI产品体系涵盖基础层(AI搜索、Gemini模型、TPU算力)、赋能层(开发者工具)和体验层(多模态内容创作、Agent平台)。
  • Gemini系列模型持续迭代,提升了多模态能力和推理能力,如Gemini 2.5 Pro的Deep Think和Flash的速度优化。
  • Google在AI产品功能上不断创新,如Veo 3的视频生成、Flow的视频编辑和Project Mariner的Agent平台。
  • Google还更新了Deep Research功能,支持上传文档和生成信息图,提升了实用性。
  • 文章预测2025年将是Google在AI领域全面爆发的一年,其全栈式AI产品体系将全面开战。

Full Content

问你一个问题:什么样的巨头最可怕?

当一个巨头能克制赚钱欲望的时候。它宁可少赚,也要完成战略转型、跟上时代。你千万别小瞧这一点——过去多少巨头就死在这上面。

今天的Google就进入了这样的状态。他们在传统搜索的商业模式如何跟AI结合还不明确的情况下,还是推出了搜索的AI模式。

现在,你可以问Google任何东西,不管是一个简单的问题,还是一个超长的问题,甚至一个问题里包含了十个问题,它都能理解。你还可以让它帮你搜集信息、帮你做出购物决策。你可以说给它听,可以打字给它,或者拍给它看,都行。

资本市场不是很看好。因为,传统的广告收入肯定会受影响——你都直接拿到答案了,自然没必要再点那些链接。另外,流量分配也会发生巨大改变。这会冲击到整个内容生态和广告网络。

但是,没办法。作为巨头,你不主动AI First,那就是等着别人来革你的命!

哈喽各位好,欢迎回到我的频道。谦虚地说,我是国内少数几个能把关于AI的Why和How讲明白的博主。我提供的东西远比教程更值钱。记得点一波关注。如果想链接我,就来我们newtype社群。已经有1000多位小伙伴付费加入啦。

回到今天的主题:AI版的Google。

在今年三月的视频中,我做了一个预测:2025年,Gemini会奠定谷歌AI在C端市场的统治地位。

后来的发展,比如Gemini 2.5 Pro的推出,印证了我的判断。前几天的I/O大会更加坚定了我的信心。而且,不只是Gemini——这次大会发布的一大堆东西,都让我们看到了一个全新的Google,一个AI时代的巨头。

因为新东西太多、信息量太大,我按照自己的逻辑,总结了三个层面。大家可以用这个框架去看这次的I/O大会。

最重要的是基础层。

刚才说的搜索属于基础层。因为它不仅仅是一个产品,更是Google核心能力和海量数据的体现。通过AI模式,搜索正在被重塑成为一个更智能、更有对话性的入口,并且为模型提供持续的、真实世界的数据和用户交互 。

以Gemini系列为核心的模型是基础层的第二个关键。这次大会上有很多更新,包括Gemini 2.5 Pro增加Deep Think能力,Gemini 2.5 Flash速度和效率的优化,以及新的Gemma 3n,配置要求低,很适合在日常设备上运行。这些模型的持续迭代,以及多模态能力的提升,是实现更高级智能的基础。

算力基建是基础层第三个关键。Google的TPU已经出到第七代了。这些定制硬件为复杂模型的训练和大规模推理提供强大的算力支持和能效保障。这是Google战略的物理基石。

在基础层之上,是两个层面。

一个是赋能层,主要面向开发者。Google通过增强的Gemini API、Vertex AI等等一大套东西,为开发者提供了构建、部署和管理AI应用的工具集。

另一个是体验层,主要面向用户。这次大会那些bling-bling的东西都属于体验层。比如,Google Beam的沉浸式3D通信,Android XR的混合现实交互,以及Veo 3和Flow的生成式内容创作。

至于面向未来的Project Mariner把这三个层面融会贯通了。它代表了Google实现“通用AI助手”的野心。

你别觉得刚才说的这些都是Google在画饼。其实很多已经推出了,比如Veo 3、Flow、Project Mariner。少数在未来几周也会推出,比如Gemini 2.5 Pro的深度思考功能。

我特意升级到Ultra会员,体验了一把。

Veo 3真的非常惊艳!难怪Twitter上都在疯传。除了视觉上非常逼真之外,这次Google还加入了音频功能。比如这一段。

而Flow则是基于Google视频模型的编辑平台。你可以在上边用文字生成片段,然后再把片段拼接起来。Twitter上已经有人用Flow做出很不错的作品了,比如这一段。

Project Mariner就是Agent平台,具备类似Computer Use的能力。我试了一下,它操作浏览器、点击网页上的按钮都比较顺畅了。如果遇到需要登录账号的情况,会停下来,把控制权移交给用户。