AI飞行客

掠过技术的云层,落地在工程的原野

Google I/O 2026 观后感:当 AI 吞掉一切,你还剩多少控制权?

——Google I/O 2026 观后:当 AI 从工具变成操作系统,你还剩多少控制权?

Kate | 2026年5月20日

一、开场:Google 终于不讲 PPT 了

每年看 Google I/O,我都有一个固定的情绪曲线:前三十分钟「哇塞」,中间三十分钟「嗯……」,最后三十分钟「所以这跟我有什么关系?」

但今年的 I/O,有点不一样。

不是那种「我们做了一个新模型,参数量又大了十倍」的无聊叙事。Google 这次摆出的姿态是:AI 不再是你的工具,AI 要变成你的操作系统。

从 Android 17 到 Gemini Spark,从 Google Search 到 Universal Cart,Google 的逻辑非常清晰——把一切复杂操作压缩成一个输入框,让 AI 在系统底层帮你一步到位。

这个愿景很激进。但激进不等于成熟。我们一个个来拆。

二、Gemini 生态:模型本身已经不是重点了

先说说模型。Google 发布了 Gemini 3.5 Flash 和 Pro,Flash 主打性价比,Pro 下个月上线。

说实话,模型参数和 benchmark 我已经看腻了。Flash 再快、Pro 再强,如果落地场景没打通,就只是一串数字。

真正有意思的是 Gemini Omni 这个「世界模型」。30 秒生成一段符合你意图的视频,还能基于素材自动加动画和视觉元素。

这里我得泼一盆冷水:「世界模型」这个词,现在谁用谁像骗子。

OpenAI 的 Sora 刚出来时也叫世界模型,结果半年过去,视频里的物理规律该崩还是崩。Google Omni 的 demo 看着惊艳,但能不能稳定生成「一杯水从桌上倒下来,水流遵循重力」这种基础物理场景?我持保留态度。

不过 Omni 的交互思路是对的——上传素材、自然语言描述、AI 自动补完。这才是视频生成的正确打开方式,而不是从零生成一段完全脱离上下文的视频。

三、12 小时写一个 OS:最震撼的 demo,也是最大的陷阱

整个发布会最抓眼球的,是这段:基于 antraffity 2.0 的 AI Agent,只用 12 个小时,从零写出了一个完整的操作系统,还能安装 Chrome,还配套了应用生态。

Google 说,这在以前需要团队研发 3 到 7 年。

我先说我的反应:震撼,但千万别上头。

12 小时写 OS 不是「AI 超越人类」的证据,而是「AI 能把 demo 写得很漂亮」的证据。一个能跑起来的 OS shell、一个能装 Chrome 的容器、一套基础应用——这确实是工程奇迹,但距离「生产级操作系统」还差十万八千里。

Linux 内核写了多少年?Windows NT 花了多少人力?这些系统能活下来,靠的不是「能不能跑」,而是「能不能扛住十亿用户的异常输入、恶意攻击、硬件兼容性、二十年技术债务」。

AI 写代码的速度确实恐怖,但代码只是实现物,工程化才是护城河。这也是我一直强调的 Harness Engineering 的核心——AI 能写 80%,但剩下的 20% 架构边界、安全审计、长期维护,才是人类的价值。

这个 demo 的真正意义在于:AI 的 Agentic 能力已经跨过了「玩具」阶段,进入了「原型」阶段。从原型到产品,中间隔着的是无数个深夜的 on-call 和血泪的兼容性问题。但至少,原型阶段的门已经打开了。

四、Gemini Spark:秘书还是监控?

Gemini Spark 被定位为「Cloud 端的 AI 雇员」,相当于个人线上秘书。你说话交代任务,AI 在后台联网、连 SaaS、跨平台、多步骤一口气搞定。

这个产品的想象空间很大,但风险同样大。

问题一:权限边界在哪里? 一个能连你 Gmail、Google Drive、各种 SaaS 的 AI,理论上能看到你的一切。Google 的隐私记录……咱们心里有数。

问题二:出错谁负责? AI 秘书帮你订了机票,结果订错日期,造成的损失算谁的?Google 的条款里肯定有免责条款,但用户的心理账不会免。

问题三:过度依赖的代价。 当一切任务都可以「交给 AI 处理」,人类的判断力和执行能力会快速退化。这不是危言耸听——看看现在还有人背电话号码吗?

Gemini Spark 的方向是对的,但它的成熟路径会很长,而且必然伴随大量的信任危机。

五、Search 变 App、购物车变 AI:Google 在重写互联网

未来 Google 搜索不再给你几行文字或链接,而是由 AI 直接根据你的问题,实时生成一个完整的定制化 UI 来解答。

这个变化听起来很小,实际上是在动摇互联网的根基。

过去二十年,Google 是互联网的「流量入口」——用户搜关键词,Google 给链接,网站靠流量活着。但现在 Google 说:不用去那些网站了,我直接给你做一个页面。

这意味着什么?中间商(内容网站)被彻底架空。你写一篇产品评测,用户再也看不到;Google 直接把你的内容消化掉,生成一个更漂亮的页面给用户。

同样的事情发生在购物上。Universal Cart 贯通 Google、Gemini、YouTube、Gmail,AI 跨网站帮你下单,还提醒硬件兼容性、信用卡优惠。

听着很方便,但细想一下:当 AI 替你决定「买什么、在哪买、用哪张卡」,你的消费决策权还剩多少? Google 会不会优先推荐给自己返点更高的商家?AI 的「最优解」真的是你的最优解吗?

Google 在做的,本质上是在互联网和用户之间插入一层越来越厚的 AI 中介。短期看,体验确实更好;长期看,互联网的去中心化精神正在被一点点蚕食。

六、Android 17:最务实的一步棋

如果说 Gemini Spark 和 Search 还有点「画饼」的意思,那 Android 17 的升级是最接地气的。

Google 把手机 OS 重新定位为 「AI 智能系统」,围绕 Gemini 重构。几个关键点:

  • AI 自动填表: 从邮件里提取信息,自动完成网页表单。这功能看着小,但用一次就回不去了。
  • AI Voice Typing: 语音输入加了一层 AI 整理。你说得语无伦次、前后矛盾、讲到一半重说,AI 都能梳理成逻辑清晰的文字,还支持粤语和英文混合输入。
  • 3D 动态 Emoji: AI 实时渲染,看着花哨,但确实是端侧 AI 算力的展示。
  • 防沉迷弹窗: 检测到你反复打开同一个 App,主动阻止并建议换 App。这个功能……说实话有点越界,但方向是对的——数字健康不能只靠自觉。
  • 跨平台隔空投送: Android 和 iPhone 原生互传。终于。

Android 17 的这些功能有个共同特点:不炫技,但高频。 你每天打字、填表、传文件、发消息,这些才是 AI 真正该渗透的地方。不是帮你写 OS,而是帮你少点几下屏幕。

另外,Google 宣布和 Meta(Ray-Ban)、三星合作推出智能音频眼镜,支持 Android/iOS 双系统。这是 Google 在硬件端的务实布局——眼镜比手机更私密、更随时在线,是 AI 助理的最佳载体。

七、创作者工具:Google 终于想起 YouTube 了

Google Pix(图像编辑)、Stitch(设计图转代码)、Flow(视频多机位+自动生成配乐),这套组合拳打的是谁?

打的是 OpenAI 的 Sora + DALL-E 生态,也是 Runway、Pika 这些视频 AI 初创公司。

Flow 的一镜转多角度特别有意思——拍一段视频,AI 自动生成 16 个不同机位。这对创作者来说,意味着拍摄成本的大幅下降。 以前要架三四个机位的访谈,现在一个机位就够了。

Stitch 让 AI 把设计图直接转成代码,这个领域已经有 v0、Tempo 等产品在做了。Google 进场,优势是生态整合——设计图从 Figma 来(虽然 Google 没有 Figma,但有 Google Docs 和 Workspace),代码直接丢进 Android Studio。

但创作者工具的竞争关键不在「功能有没有」,而在「输出质量稳不稳」。AI 生成的视频多机位,如果某个角度里人物的手是六指,那整个素材就废了。Google 在这些工具上的真实可用性,还需要社区的大规模验证。

八、Google Book 和 AI 鼠标指针:最 Google 的产品

压轴的 Google Book,核心卖点是「AI 鼠标指针」——圈选屏幕上的内容,唤醒 Gemini 帮你分析或批量处理。

这个产品很 Google。它不是要解决一个具体痛点,而是在展示一种交互范式。

鼠标指针变成 AI 的触发器,意味着「选择」这个动作被重新定义。以前你选中文字是为了复制粘贴,现在选中任何东西都可以变成对 AI 的指令。

但这个产品的尴尬之处在于:Chromebook 都没卖好,Google Book 凭什么? 如果 Google 想靠 AI 指针打开硬件市场,它需要的不是一个好功能,而是一整套让用户不得不换设备的生态引力。目前来看,这套引力还不够强。

九、总结:Google 的终极野心

整场 I/O 看下来,Google 的叙事非常统一:

把一切复杂操作简化为一个输入框。

购物、规划、联络、写代码、做视频、管理日程——所有这些,你不需要懂背后的逻辑,不需要打开十个 App,不需要记忆复杂的操作流程。你只需要说话,AI 在系统底层帮你搞定。

这个愿景很诱人,但也暗藏危险。

危险一:能力的空心化。 当 AI 替你做了所有决策,人类的判断力和问题解决能力会萎缩。这不是科幻,这是已经在发生的事情。

危险二:控制权的转移。 你把越多决策交给 Google 的 AI,Google 对你的生活就越有控制力。它决定你看到什么、买到什么、怎么去哪里。这不是阴谋论,这是商业逻辑——Google 的广告收入取决于它对你行为的预测精度。

危险三:系统的脆弱性。 一个把所有功能都押在 AI 上的操作系统,一旦 AI 出错,用户没有任何退路。传统的软件有明确的输入输出、可预测的边界;AI 系统的输出是概率性的,黑箱的,不可审计的。

但话说回来,趋势是不可逆的。Google I/O 2026 让我看到的不是一个「未来可能实现」的蓝图,而是一个「正在发生」的转折点。

Android 从 OS 变成 AI 系统,Search 从流量入口变成内容生产者,购物车从工具变成决策代理——Google 正在用 AI 重写互联网的每一条规则。

作为用户,我们能做的不是拒绝这个趋势,而是保持清醒:享受 AI 带来的便利,但永远保留「不用 AI 也能搞定」的能力。

毕竟,当你的 AI 秘书罢工那天,你总得自己订机票吧。

—— END ——

发表回复

Your email address will not be published. Required fields are marked *.

*
*