Google I/O 2026 观后感:当 AI 吞掉一切,你还剩多少控制权?
——Google I/O 2026 观后:当 AI 从工具变成操作系统,你还剩多少控制权?
Kate | 2026年5月20日
一、开场:Google 终于不讲 PPT 了
每年看 Google I/O,我都有一个固定的情绪曲线:前三十分钟「哇塞」,中间三十分钟「嗯……」,最后三十分钟「所以这跟我有什么关系?」
但今年的 I/O,有点不一样。
不是那种「我们做了一个新模型,参数量又大了十倍」的无聊叙事。Google 这次摆出的姿态是:AI 不再是你的工具,AI 要变成你的操作系统。
从 Android 17 到 Gemini Spark,从 Google Search 到 Universal Cart,Google 的逻辑非常清晰——把一切复杂操作压缩成一个输入框,让 AI 在系统底层帮你一步到位。
这个愿景很激进。但激进不等于成熟。我们一个个来拆。
二、Gemini 生态:模型本身已经不是重点了
先说说模型。Google 发布了 Gemini 3.5 Flash 和 Pro,Flash 主打性价比,Pro 下个月上线。
说实话,模型参数和 benchmark 我已经看腻了。Flash 再快、Pro 再强,如果落地场景没打通,就只是一串数字。
真正有意思的是 Gemini Omni 这个「世界模型」。30 秒生成一段符合你意图的视频,还能基于素材自动加动画和视觉元素。
这里我得泼一盆冷水:「世界模型」这个词,现在谁用谁像骗子。
OpenAI 的 Sora 刚出来时也叫世界模型,结果半年过去,视频里的物理规律该崩还是崩。Google Omni 的 demo 看着惊艳,但能不能稳定生成「一杯水从桌上倒下来,水流遵循重力」这种基础物理场景?我持保留态度。
不过 Omni 的交互思路是对的——上传素材、自然语言描述、AI 自动补完。这才是视频生成的正确打开方式,而不是从零生成一段完全脱离上下文的视频。
三、12 小时写一个 OS:最震撼的 demo,也是最大的陷阱
整个发布会最抓眼球的,是这段:基于 antraffity 2.0 的 AI Agent,只用 12 个小时,从零写出了一个完整的操作系统,还能安装 Chrome,还配套了应用生态。
Google 说,这在以前需要团队研发 3 到 7 年。
我先说我的反应:震撼,但千万别上头。
12 小时写 OS 不是「AI 超越人类」的证据,而是「AI 能把 demo 写得很漂亮」的证据。一个能跑起来的 OS shell、一个能装 Chrome 的容器、一套基础应用——这确实是工程奇迹,但距离「生产级操作系统」还差十万八千里。
Linux 内核写了多少年?Windows NT 花了多少人力?这些系统能活下来,靠的不是「能不能跑」,而是「能不能扛住十亿用户的异常输入、恶意攻击、硬件兼容性、二十年技术债务」。
AI 写代码的速度确实恐怖,但代码只是实现物,工程化才是护城河。这也是我一直强调的 Harness Engineering 的核心——AI 能写 80%,但剩下的 20% 架构边界、安全审计、长期维护,才是人类的价值。
这个 demo 的真正意义在于:AI 的 Agentic 能力已经跨过了「玩具」阶段,进入了「原型」阶段。从原型到产品,中间隔着的是无数个深夜的 on-call 和血泪的兼容性问题。但至少,原型阶段的门已经打开了。
四、Gemini Spark:秘书还是监控?
Gemini Spark 被定位为「Cloud 端的 AI 雇员」,相当于个人线上秘书。你说话交代任务,AI 在后台联网、连 SaaS、跨平台、多步骤一口气搞定。
这个产品的想象空间很大,但风险同样大。
问题一:权限边界在哪里? 一个能连你 Gmail、Google Drive、各种 SaaS 的 AI,理论上能看到你的一切。Google 的隐私记录……咱们心里有数。
问题二:出错谁负责? AI 秘书帮你订了机票,结果订错日期,造成的损失算谁的?Google 的条款里肯定有免责条款,但用户的心理账不会免。
问题三:过度依赖的代价。 当一切任务都可以「交给 AI 处理」,人类的判断力和执行能力会快速退化。这不是危言耸听——看看现在还有人背电话号码吗?
Gemini Spark 的方向是对的,但它的成熟路径会很长,而且必然伴随大量的信任危机。
五、Search 变 App、购物车变 AI:Google 在重写互联网
未来 Google 搜索不再给你几行文字或链接,而是由 AI 直接根据你的问题,实时生成一个完整的定制化 UI 来解答。
这个变化听起来很小,实际上是在动摇互联网的根基。
过去二十年,Google 是互联网的「流量入口」——用户搜关键词,Google 给链接,网站靠流量活着。但现在 Google 说:不用去那些网站了,我直接给你做一个页面。
这意味着什么?中间商(内容网站)被彻底架空。你写一篇产品评测,用户再也看不到;Google 直接把你的内容消化掉,生成一个更漂亮的页面给用户。
同样的事情发生在购物上。Universal Cart 贯通 Google、Gemini、YouTube、Gmail,AI 跨网站帮你下单,还提醒硬件兼容性、信用卡优惠。
听着很方便,但细想一下:当 AI 替你决定「买什么、在哪买、用哪张卡」,你的消费决策权还剩多少? Google 会不会优先推荐给自己返点更高的商家?AI 的「最优解」真的是你的最优解吗?
Google 在做的,本质上是在互联网和用户之间插入一层越来越厚的 AI 中介。短期看,体验确实更好;长期看,互联网的去中心化精神正在被一点点蚕食。
六、Android 17:最务实的一步棋
如果说 Gemini Spark 和 Search 还有点「画饼」的意思,那 Android 17 的升级是最接地气的。
Google 把手机 OS 重新定位为 「AI 智能系统」,围绕 Gemini 重构。几个关键点:
- AI 自动填表: 从邮件里提取信息,自动完成网页表单。这功能看着小,但用一次就回不去了。
- AI Voice Typing: 语音输入加了一层 AI 整理。你说得语无伦次、前后矛盾、讲到一半重说,AI 都能梳理成逻辑清晰的文字,还支持粤语和英文混合输入。
- 3D 动态 Emoji: AI 实时渲染,看着花哨,但确实是端侧 AI 算力的展示。
- 防沉迷弹窗: 检测到你反复打开同一个 App,主动阻止并建议换 App。这个功能……说实话有点越界,但方向是对的——数字健康不能只靠自觉。
- 跨平台隔空投送: Android 和 iPhone 原生互传。终于。
Android 17 的这些功能有个共同特点:不炫技,但高频。 你每天打字、填表、传文件、发消息,这些才是 AI 真正该渗透的地方。不是帮你写 OS,而是帮你少点几下屏幕。
另外,Google 宣布和 Meta(Ray-Ban)、三星合作推出智能音频眼镜,支持 Android/iOS 双系统。这是 Google 在硬件端的务实布局——眼镜比手机更私密、更随时在线,是 AI 助理的最佳载体。
七、创作者工具:Google 终于想起 YouTube 了
Google Pix(图像编辑)、Stitch(设计图转代码)、Flow(视频多机位+自动生成配乐),这套组合拳打的是谁?
打的是 OpenAI 的 Sora + DALL-E 生态,也是 Runway、Pika 这些视频 AI 初创公司。
Flow 的一镜转多角度特别有意思——拍一段视频,AI 自动生成 16 个不同机位。这对创作者来说,意味着拍摄成本的大幅下降。 以前要架三四个机位的访谈,现在一个机位就够了。
Stitch 让 AI 把设计图直接转成代码,这个领域已经有 v0、Tempo 等产品在做了。Google 进场,优势是生态整合——设计图从 Figma 来(虽然 Google 没有 Figma,但有 Google Docs 和 Workspace),代码直接丢进 Android Studio。
但创作者工具的竞争关键不在「功能有没有」,而在「输出质量稳不稳」。AI 生成的视频多机位,如果某个角度里人物的手是六指,那整个素材就废了。Google 在这些工具上的真实可用性,还需要社区的大规模验证。
八、Google Book 和 AI 鼠标指针:最 Google 的产品
压轴的 Google Book,核心卖点是「AI 鼠标指针」——圈选屏幕上的内容,唤醒 Gemini 帮你分析或批量处理。
这个产品很 Google。它不是要解决一个具体痛点,而是在展示一种交互范式。
鼠标指针变成 AI 的触发器,意味着「选择」这个动作被重新定义。以前你选中文字是为了复制粘贴,现在选中任何东西都可以变成对 AI 的指令。
但这个产品的尴尬之处在于:Chromebook 都没卖好,Google Book 凭什么? 如果 Google 想靠 AI 指针打开硬件市场,它需要的不是一个好功能,而是一整套让用户不得不换设备的生态引力。目前来看,这套引力还不够强。
九、总结:Google 的终极野心
整场 I/O 看下来,Google 的叙事非常统一:
把一切复杂操作简化为一个输入框。
购物、规划、联络、写代码、做视频、管理日程——所有这些,你不需要懂背后的逻辑,不需要打开十个 App,不需要记忆复杂的操作流程。你只需要说话,AI 在系统底层帮你搞定。
这个愿景很诱人,但也暗藏危险。
危险一:能力的空心化。 当 AI 替你做了所有决策,人类的判断力和问题解决能力会萎缩。这不是科幻,这是已经在发生的事情。
危险二:控制权的转移。 你把越多决策交给 Google 的 AI,Google 对你的生活就越有控制力。它决定你看到什么、买到什么、怎么去哪里。这不是阴谋论,这是商业逻辑——Google 的广告收入取决于它对你行为的预测精度。
危险三:系统的脆弱性。 一个把所有功能都押在 AI 上的操作系统,一旦 AI 出错,用户没有任何退路。传统的软件有明确的输入输出、可预测的边界;AI 系统的输出是概率性的,黑箱的,不可审计的。
但话说回来,趋势是不可逆的。Google I/O 2026 让我看到的不是一个「未来可能实现」的蓝图,而是一个「正在发生」的转折点。
Android 从 OS 变成 AI 系统,Search 从流量入口变成内容生产者,购物车从工具变成决策代理——Google 正在用 AI 重写互联网的每一条规则。
作为用户,我们能做的不是拒绝这个趋势,而是保持清醒:享受 AI 带来的便利,但永远保留「不用 AI 也能搞定」的能力。
毕竟,当你的 AI 秘书罢工那天,你总得自己订机票吧。
—— END ——