Google I/O 2026 观后感：当 AI 吞掉一切，你还剩多少控制权？

By - AI飞行客
Posted on 05/20/2026
Posted in AI 观察

Google I/O 2026 观后感：当 AI 吞掉一切，你还剩多少控制权？

——Google I/O 2026 观后：当 AI 从工具变成操作系统，你还剩多少控制权？

Kate | 2026年5月20日

一、开场：Google 终于不讲 PPT 了

每年看 Google I/O，我都有一个固定的情绪曲线：前三十分钟「哇塞」，中间三十分钟「嗯……」，最后三十分钟「所以这跟我有什么关系？」

但今年的 I/O，有点不一样。

不是那种「我们做了一个新模型，参数量又大了十倍」的无聊叙事。Google 这次摆出的姿态是：AI 不再是你的工具，AI 要变成你的操作系统。

从 Android 17 到 Gemini Spark，从 Google Search 到 Universal Cart，Google 的逻辑非常清晰——把一切复杂操作压缩成一个输入框，让 AI 在系统底层帮你一步到位。

这个愿景很激进。但激进不等于成熟。我们一个个来拆。

二、Gemini 生态：模型本身已经不是重点了

先说说模型。Google 发布了 Gemini 3.5 Flash 和 Pro，Flash 主打性价比，Pro 下个月上线。

说实话，模型参数和 benchmark 我已经看腻了。Flash 再快、Pro 再强，如果落地场景没打通，就只是一串数字。

真正有意思的是 Gemini Omni 这个「世界模型」。30 秒生成一段符合你意图的视频，还能基于素材自动加动画和视觉元素。

这里我得泼一盆冷水：「世界模型」这个词，现在谁用谁像骗子。

OpenAI 的 Sora 刚出来时也叫世界模型，结果半年过去，视频里的物理规律该崩还是崩。Google Omni 的 demo 看着惊艳，但能不能稳定生成「一杯水从桌上倒下来，水流遵循重力」这种基础物理场景？我持保留态度。

不过 Omni 的交互思路是对的——上传素材、自然语言描述、AI 自动补完。这才是视频生成的正确打开方式，而不是从零生成一段完全脱离上下文的视频。

三、12 小时写一个 OS：最震撼的 demo，也是最大的陷阱

整个发布会最抓眼球的，是这段：基于 antraffity 2.0 的 AI Agent，只用 12 个小时，从零写出了一个完整的操作系统，还能安装 Chrome，还配套了应用生态。

Google 说，这在以前需要团队研发 3 到 7 年。

我先说我的反应：震撼，但千万别上头。

12 小时写 OS 不是「AI 超越人类」的证据，而是「AI 能把 demo 写得很漂亮」的证据。一个能跑起来的 OS shell、一个能装 Chrome 的容器、一套基础应用——这确实是工程奇迹，但距离「生产级操作系统」还差十万八千里。

Linux 内核写了多少年？Windows NT 花了多少人力？这些系统能活下来，靠的不是「能不能跑」，而是「能不能扛住十亿用户的异常输入、恶意攻击、硬件兼容性、二十年技术债务」。

AI 写代码的速度确实恐怖，但代码只是实现物，工程化才是护城河。这也是我一直强调的 Harness Engineering 的核心——AI 能写 80%，但剩下的 20% 架构边界、安全审计、长期维护，才是人类的价值。

这个 demo 的真正意义在于：AI 的 Agentic 能力已经跨过了「玩具」阶段，进入了「原型」阶段。从原型到产品，中间隔着的是无数个深夜的 on-call 和血泪的兼容性问题。但至少，原型阶段的门已经打开了。

四、Gemini Spark：秘书还是监控？

Gemini Spark 被定位为「Cloud 端的 AI 雇员」，相当于个人线上秘书。你说话交代任务，AI 在后台联网、连 SaaS、跨平台、多步骤一口气搞定。

这个产品的想象空间很大，但风险同样大。

问题一：权限边界在哪里？ 一个能连你 Gmail、Google Drive、各种 SaaS 的 AI，理论上能看到你的一切。Google 的隐私记录……咱们心里有数。

问题二：出错谁负责？ AI 秘书帮你订了机票，结果订错日期，造成的损失算谁的？Google 的条款里肯定有免责条款，但用户的心理账不会免。

问题三：过度依赖的代价。 当一切任务都可以「交给 AI 处理」，人类的判断力和执行能力会快速退化。这不是危言耸听——看看现在还有人背电话号码吗？

Gemini Spark 的方向是对的，但它的成熟路径会很长，而且必然伴随大量的信任危机。

五、Search 变 App、购物车变 AI：Google 在重写互联网

未来 Google 搜索不再给你几行文字或链接，而是由 AI 直接根据你的问题，实时生成一个完整的定制化 UI 来解答。

这个变化听起来很小，实际上是在动摇互联网的根基。

过去二十年，Google 是互联网的「流量入口」——用户搜关键词，Google 给链接，网站靠流量活着。但现在 Google 说：不用去那些网站了，我直接给你做一个页面。

这意味着什么？中间商（内容网站）被彻底架空。你写一篇产品评测，用户再也看不到；Google 直接把你的内容消化掉，生成一个更漂亮的页面给用户。

同样的事情发生在购物上。Universal Cart 贯通 Google、Gemini、YouTube、Gmail，AI 跨网站帮你下单，还提醒硬件兼容性、信用卡优惠。

听着很方便，但细想一下：当 AI 替你决定「买什么、在哪买、用哪张卡」，你的消费决策权还剩多少？ Google 会不会优先推荐给自己返点更高的商家？AI 的「最优解」真的是你的最优解吗？

Google 在做的，本质上是在互联网和用户之间插入一层越来越厚的 AI 中介。短期看，体验确实更好；长期看，互联网的去中心化精神正在被一点点蚕食。

六、Android 17：最务实的一步棋

如果说 Gemini Spark 和 Search 还有点「画饼」的意思，那 Android 17 的升级是最接地气的。

Google 把手机 OS 重新定位为 「AI 智能系统」，围绕 Gemini 重构。几个关键点：

AI 自动填表： 从邮件里提取信息，自动完成网页表单。这功能看着小，但用一次就回不去了。
AI Voice Typing： 语音输入加了一层 AI 整理。你说得语无伦次、前后矛盾、讲到一半重说，AI 都能梳理成逻辑清晰的文字，还支持粤语和英文混合输入。
3D 动态 Emoji： AI 实时渲染，看着花哨，但确实是端侧 AI 算力的展示。
防沉迷弹窗： 检测到你反复打开同一个 App，主动阻止并建议换 App。这个功能……说实话有点越界，但方向是对的——数字健康不能只靠自觉。
跨平台隔空投送： Android 和 iPhone 原生互传。终于。

Android 17 的这些功能有个共同特点：不炫技，但高频。 你每天打字、填表、传文件、发消息，这些才是 AI 真正该渗透的地方。不是帮你写 OS，而是帮你少点几下屏幕。

另外，Google 宣布和 Meta（Ray-Ban）、三星合作推出智能音频眼镜，支持 Android/iOS 双系统。这是 Google 在硬件端的务实布局——眼镜比手机更私密、更随时在线，是 AI 助理的最佳载体。

七、创作者工具：Google 终于想起 YouTube 了

Google Pix（图像编辑）、Stitch（设计图转代码）、Flow（视频多机位+自动生成配乐），这套组合拳打的是谁？

打的是 OpenAI 的 Sora + DALL-E 生态，也是 Runway、Pika 这些视频 AI 初创公司。

Flow 的一镜转多角度特别有意思——拍一段视频，AI 自动生成 16 个不同机位。这对创作者来说，意味着拍摄成本的大幅下降。 以前要架三四个机位的访谈，现在一个机位就够了。

Stitch 让 AI 把设计图直接转成代码，这个领域已经有 v0、Tempo 等产品在做了。Google 进场，优势是生态整合——设计图从 Figma 来（虽然 Google 没有 Figma，但有 Google Docs 和 Workspace），代码直接丢进 Android Studio。

但创作者工具的竞争关键不在「功能有没有」，而在「输出质量稳不稳」。AI 生成的视频多机位，如果某个角度里人物的手是六指，那整个素材就废了。Google 在这些工具上的真实可用性，还需要社区的大规模验证。

八、Google Book 和 AI 鼠标指针：最 Google 的产品

压轴的 Google Book，核心卖点是「AI 鼠标指针」——圈选屏幕上的内容，唤醒 Gemini 帮你分析或批量处理。

这个产品很 Google。它不是要解决一个具体痛点，而是在展示一种交互范式。

鼠标指针变成 AI 的触发器，意味着「选择」这个动作被重新定义。以前你选中文字是为了复制粘贴，现在选中任何东西都可以变成对 AI 的指令。

但这个产品的尴尬之处在于：Chromebook 都没卖好，Google Book 凭什么？ 如果 Google 想靠 AI 指针打开硬件市场，它需要的不是一个好功能，而是一整套让用户不得不换设备的生态引力。目前来看，这套引力还不够强。

九、总结：Google 的终极野心

整场 I/O 看下来，Google 的叙事非常统一：

把一切复杂操作简化为一个输入框。

购物、规划、联络、写代码、做视频、管理日程——所有这些，你不需要懂背后的逻辑，不需要打开十个 App，不需要记忆复杂的操作流程。你只需要说话，AI 在系统底层帮你搞定。

这个愿景很诱人，但也暗藏危险。

危险一：能力的空心化。 当 AI 替你做了所有决策，人类的判断力和问题解决能力会萎缩。这不是科幻，这是已经在发生的事情。

危险二：控制权的转移。 你把越多决策交给 Google 的 AI，Google 对你的生活就越有控制力。它决定你看到什么、买到什么、怎么去哪里。这不是阴谋论，这是商业逻辑——Google 的广告收入取决于它对你行为的预测精度。

危险三：系统的脆弱性。 一个把所有功能都押在 AI 上的操作系统，一旦 AI 出错，用户没有任何退路。传统的软件有明确的输入输出、可预测的边界；AI 系统的输出是概率性的，黑箱的，不可审计的。

但话说回来，趋势是不可逆的。Google I/O 2026 让我看到的不是一个「未来可能实现」的蓝图，而是一个「正在发生」的转折点。

Android 从 OS 变成 AI 系统，Search 从流量入口变成内容生产者，购物车从工具变成决策代理——Google 正在用 AI 重写互联网的每一条规则。

作为用户，我们能做的不是拒绝这个趋势，而是保持清醒：享受 AI 带来的便利，但永远保留「不用 AI 也能搞定」的能力。

毕竟，当你的 AI 秘书罢工那天，你总得自己订机票吧。

—— END ——

AI飞行客

近期文章

近期评论

归档

分类

Google I/O 2026 观后感：当 AI 吞掉一切，你还剩多少控制权？

一、开场：Google 终于不讲 PPT 了

二、Gemini 生态：模型本身已经不是重点了

三、12 小时写一个 OS：最震撼的 demo，也是最大的陷阱

四、Gemini Spark：秘书还是监控？

五、Search 变 App、购物车变 AI：Google 在重写互联网

六、Android 17：最务实的一步棋

七、创作者工具：Google 终于想起 YouTube 了

八、Google Book 和 AI 鼠标指针：最 Google 的产品

九、总结：Google 的终极野心

Previous Article

Next Article

发表回复取消回复

AI飞行客

近期文章

近期评论

归档

分类

Google I/O 2026 观后感：当 AI 吞掉一切，你还剩多少控制权？

一、开场：Google 终于不讲 PPT 了

二、Gemini 生态：模型本身已经不是重点了

三、12 小时写一个 OS：最震撼的 demo，也是最大的陷阱

四、Gemini Spark：秘书还是监控？

五、Search 变 App、购物车变 AI：Google 在重写互联网

六、Android 17：最务实的一步棋

七、创作者工具：Google 终于想起 YouTube 了

八、Google Book 和 AI 鼠标指针：最 Google 的产品

九、总结：Google 的终极野心

Previous Article

Next Article

发表回复 取消回复

发表回复取消回复