AI圆桌π - Google I/O 2025: 搜索将被颠覆——办事代替回答 - EarsOnMe

主播

节目简介

来源：小宇宙

谷歌 I/O 2025 开发者大会简报会议日期与地点： 2025年5月20日（周二）至21日（周三），山景城海岸线圆形剧场
核心主题：人工智能（AI）在谷歌全线产品中的深度整合与范式转移，特别是搜索从“回答问题”向“执行任务”的转变。
AI 核心能力提升与产品线扩展：
Gemini Ultra：谷歌最高级别的人工智能访问订阅服务（目前仅限美国），月费 249.99 美元。包含访问 Veo 3 视频生成器、Flow 视频编辑应用、Gemini 2.5 Pro Deep Think 模式（即将上线）等。提供更高使用额度的 NotebookLM 和 Whisk，以及 Chrome 中的 Gemini 聊天机器人、部分 Project Mariner 代理工具、YouTube Premium 服务以及 Google Drive、Google Photos 和 Gmail 的 30TB 存储空间。
Gemini 2.5 Pro 的 Deep Think 模式： Gemini 旗舰模型的“增强型”推理模式，能在回答前考虑多个答案，提升特定基准测试表现。已通过 Gemini API 向“可信测试人员”开放。
Veo 3 视频生成模型：能够生成音效、背景噪音和对话，质量比 Veo 2 有提升。通过文本或图像提示使用。已向 AI Ultra 订阅用户开放。
Imagen 4 图像生成器：速度比 Imagen 3 更快，未来计划推出快 10 倍的变体。能渲染精细细节（如织物、水滴、动物皮毛），支持写实和抽象风格，生成高达 2K 分辨率的图像。Veo 3 和 Imagen 4 将支持 Flow 应用。
Gemma 3n：设计用于在手机、笔记本电脑和平板电脑上“流畅运行”的模型，支持处理音频、文本、图像和视频。已提供预览版。
Lyria RealTime：为实验性音乐制作应用提供动力的 AI 模型，现已通过 API 开放。
SynthID Detector：使用 SynthID 水印技术帮助识别人工智能生成内容的验证门户。
搜索范式重构：“AI 模式”与“任务助手”
核心理念转变： Google 搜索不再仅仅是返回链接集合，而是通过 AI 直接理解用户意图并执行多步骤任务。“搜索框不重要了，接下来 Google 会直接帮你把事办了。”（Sundar Pichai 语）
AI 模式（AI Mode）： Google 搜索的新界面，不是展示答案，而是“自动帮你完成任务”的系统。它能分析复杂意图（审美、家庭结构、预算等），展示可视化选项，推荐对应商品/服务，并自动回答相关问题。用户无需点击链接或跳转页面。
底层技术：Query Fanout + Gemini 2.5 多步推理。用户一次提问，系统在后台分拆成几十个子问题，调用多个数据库、商业图谱、地图系统等，综合生成结构化的完整答案和行动建议。这是从“展示网页”到“直接完成任务”的转变。
Project Mariner：谷歌最重要的“动手能力”系统，是全新的底层代理系统，负责“你说目标，它来执行”。它能浏览和使用网站，处理多达近十二项任务，例如代用户购买棒球比赛门票或在线购买杂货，无需用户访问第三方网站。“这不是推荐网页，也不是展示结果——它是真正去干活。”（Rajan Patel 语）具有 Teach & Repeat（学习&重复）机制，用户演示一次，系统就能学会并在之后自动执行相似任务。被定义为谷歌正在构建的通用 AI 执行代理。
AI 模式的深入应用：支持在体育和金融查询中使用复杂数据，为服装提供“试穿”选项。未来将支持根据手机摄像头实时捕捉的内容提问（Search Live）。
Gemini 搜索的体验：直接给出结果，甚至生成图表、建议和决策路径。例如，查询棒球数据可自动生成对比图表；查询适合独自就餐的餐厅可生成结构清晰的可视化清单。搜索不再只是找到信息，而是像一位私人顾问，给出结构化答案和可执行方案，甚至具备“自己检查答案”的能力。
AI 应用与交互的扩展：
Gemini 应用更新：月活跃用户超过 400 万。Gemini Live（摄像头和屏幕共享功能）本周面向所有 iOS 和 Android 用户推出，支持与 Gemini 近乎实时的语音对话并流式传输摄像头/屏幕画面，由 Project Astra 提供支持。未来几周将更深入集成 Google 地图、Google 日历和 Google 任务。Deep Research 将支持用户上传私人 PDF 和图像。
Project Astra：谷歌的低延迟多模态人工智能体验，将为搜索、Gemini 应用和第三方开发者产品提供新体验。源自 Google DeepMind，旨在展示近乎实时的多模态 AI 能力。能从用户看到的场景中主动理解并提供回应，“摄像头成了新‘搜索框’”。正在与三星和 Warby Parker 等合作伙伴开发 Project Astra 眼镜，将搜索带向“随时在场”的状态。
AI 模式（AI Mode）： Google 搜索的实验性功能，允许用户通过 AI 界面提出复杂的、多部分的问题。
Chrome 中的 Gemini：将引入新的人工智能浏览助手，帮助用户快速理解网页内容并完成任务。
开发者工具与平台更新：
Stitch：人工智能工具，通过生成用户界面元素和代码帮助用户设计网页和移动应用前端。用户可以通过文本或图像提示创建应用界面，并获取 HTML 和 CSS 标记。
Jules：旨在帮助开发者修复代码错误的 AI 代理，扩大了使用范围，可帮助理解复杂代码、创建拉取请求、处理待办事项和编程任务。
Wear OS 6：为磁贴引入统一字体，支持动态主题（Pixel 手表），使应用外观更简洁。发布设计指南和 Figma 设计文件，核心是帮助开发者构建更好的自定义功能和无缝过渡效果。
Google Play：加强 Android 开发者功能。提供处理订阅的新工具、主题页面、音频样本，以及更流畅的附加销售结账体验。电影和电视剧的“主题浏览”页面（目前仅限美国）将连接相关应用。开发者获得专门的测试和发布页面工具，以及在出现严重问题时暂停实时发布的功能。订阅管理工具升级支持多产品结账和订阅附加项一次性支付。
Android Studio：集成新的人工智能功能，包括与 Gemini 2.5 Pro 同步推出的“Journeys”（“代理人工智能”功能）和“Agent Mode”（处理更复杂开发流程）。增强应用质量洞察面板中的“崩溃洞察”功能，由 Gemini 驱动，分析源代码以识别崩溃原因并建议修复。
战略意义与核心观点：
搜索的底层重构：谷歌正在将搜索从一个信息查找工具转变为一个任务执行系统。用户不再是输入关键词寻找答案，而是表达目标，由 AI 系统自动理解、分拆任务、调用资源并完成执行。“搜索不再‘回答问题’后，谁还能抓住用户？”这个问题成为焦点，答案是谁能把“问答”变成“办事”。
AI 执行代理是新平台入口： Project Mariner 等代理系统的出现意味着 AI 不再只是内容工具，而是进入了“实质执行”的角色。谁能负责“理解用户目标 → 调用资源执行 → 给出结果”，谁就能接管下一个时代的产品控制权。这是一种新的“平台税”收取方式。
从“功能框”到“任务流编排”：产品设计思维需要从构建独立功能转向编排复杂的任务流程。Google 的整套产品（Gemini 应用、AI Mode、Project Mariner、Chrome Gemini）正在重新串联用户决策链，使平台能够调度资源并自动完成任务。
AI 的具身化与环境感知： Project Astra 和 Gemini Live 表明，AI 正走出屏幕，通过摄像头和传感器理解现实世界。“它能理解你在看什么、说什么、做什么，并主动出手。”（Demis Hassabis 语）。未来的搜索入口可能是摄像头或智能眼镜，AI 能够根据视觉线索和语境提供实时、情境化的信息和帮助。Gemini 正在从一个语言模型转变为一个世界模型。
开发者面临的挑战与机遇：随着搜索和 AI 平台逻辑的改变，开发者需要思考如何将自身产品与新的 AI 执行入口对接。谁能率先打造“任务执行入口”，谁就能成为新平台定义者。目前的挑战在于任务链重构（从点击功能转向调度目标）和调用协议联通（形成“模型 × 应用 × 权限”的统一调度机制）。
如果希望和主播建立联系/加入听友群，可加微信bonewe2004！
关于主播：

小宇宙热评

不动_TSYT

1年前河南

0

AI播客吗？

HD1021768l

1年前宁夏

0

AI 味太浓了取关

Google I/O 2025: 搜索将被颠覆——办事代替回答

加入我们的 Discord

扫描微信二维码

播放列表