Album
时长:
16分钟
播放:
105
发布:
5个月前
主播...
简介...
https://xiaoyuzhoufm.com





谷歌 I/O 2025 开发者大会简报会议日期与地点: 2025年5月20日(周二)至21日(周三),山景城海岸线圆形剧场




核心主题: 人工智能(AI)在谷歌全线产品中的深度整合与范式转移,特别是搜索从“回答问题”向“执行任务”的转变。




AI 核心能力提升与产品线扩展:

Gemini Ultra:
谷歌最高级别的人工智能访问订阅服务(目前仅限美国),月费 249.99 美元。包含访问 Veo 3 视频生成器、Flow 视频编辑应用、Gemini 2.5 Pro Deep Think 模式(即将上线)等。提供更高使用额度的 NotebookLM 和 Whisk,以及 Chrome 中的 Gemini 聊天机器人、部分 Project Mariner 代理工具、YouTube Premium 服务以及 Google Drive、Google Photos 和 Gmail 的 30TB 存储空间。




Gemini 2.5 Pro 的 Deep Think 模式: Gemini 旗舰模型的“增强型”推理模式,能在回答前考虑多个答案,提升特定基准测试表现。已通过 Gemini API 向“可信测试人员”开放。




Veo 3 视频生成模型: 能够生成音效、背景噪音和对话,质量比 Veo 2 有提升。通过文本或图像提示使用。已向 AI Ultra 订阅用户开放。




Imagen 4 图像生成器: 速度比 Imagen 3 更快,未来计划推出快 10 倍的变体。能渲染精细细节(如织物、水滴、动物皮毛),支持写实和抽象风格,生成高达 2K 分辨率的图像。Veo 3 和 Imagen 4 将支持 Flow 应用。







Gemma 3n: 设计用于在手机、笔记本电脑和平板电脑上“流畅运行”的模型,支持处理音频、文本、图像和视频。已提供预览版。




Lyria RealTime: 为实验性音乐制作应用提供动力的 AI 模型,现已通过 API 开放。




SynthID Detector: 使用 SynthID 水印技术帮助识别人工智能生成内容的验证门户。




搜索范式重构:“AI 模式”与“任务助手”

核心理念转变:
Google 搜索不再仅仅是返回链接集合,而是通过 AI 直接理解用户意图并执行多步骤任务。“搜索框不重要了,接下来 Google 会直接帮你把事办了。”(Sundar Pichai 语)

AI 模式(AI Mode): Google 搜索的新界面,不是展示答案,而是“自动帮你完成任务”的系统。它能分析复杂意图(审美、家庭结构、预算等),展示可视化选项,推荐对应商品/服务,并自动回答相关问题。用户无需点击链接或跳转页面。





底层技术:Query Fanout + Gemini 2.5 多步推理。 用户一次提问,系统在后台分拆成几十个子问题,调用多个数据库、商业图谱、地图系统等,综合生成结构化的完整答案和行动建议。这是从“展示网页”到“直接完成任务”的转变。




Project Mariner: 谷歌最重要的“动手能力”系统,是全新的底层代理系统,负责“你说目标,它来执行”。它能浏览和使用网站,处理多达近十二项任务,例如代用户购买棒球比赛门票或在线购买杂货,无需用户访问第三方网站。“这不是推荐网页,也不是展示结果——它是真正去干活。”(Rajan Patel 语)具有 Teach & Repeat(学习&重复)机制,用户演示一次,系统就能学会并在之后自动执行相似任务。被定义为谷歌正在构建的通用 AI 执行代理。




AI 模式的深入应用: 支持在体育和金融查询中使用复杂数据,为服装提供“试穿”选项。未来将支持根据手机摄像头实时捕捉的内容提问(Search Live)。




Gemini 搜索的体验: 直接给出结果,甚至生成图表、建议和决策路径。例如,查询棒球数据可自动生成对比图表;查询适合独自就餐的餐厅可生成结构清晰的可视化清单。搜索不再只是找到信息,而是像一位私人顾问,给出结构化答案和可执行方案,甚至具备“自己检查答案”的能力。




AI 应用与交互的扩展:

Gemini 应用更新:
月活跃用户超过 400 万。Gemini Live(摄像头和屏幕共享功能)本周面向所有 iOS 和 Android 用户推出,支持与 Gemini 近乎实时的语音对话并流式传输摄像头/屏幕画面,由 Project Astra 提供支持。未来几周将更深入集成 Google 地图、Google 日历和 Google 任务。Deep Research 将支持用户上传私人 PDF 和图像。




Project Astra: 谷歌的低延迟多模态人工智能体验,将为搜索、Gemini 应用和第三方开发者产品提供新体验。源自 Google DeepMind,旨在展示近乎实时的多模态 AI 能力。能从用户看到的场景中主动理解并提供回应,“摄像头成了新‘搜索框’”。正在与三星和 Warby Parker 等合作伙伴开发 Project Astra 眼镜,将搜索带向“随时在场”的状态。







AI 模式(AI Mode): Google 搜索的实验性功能,允许用户通过 AI 界面提出复杂的、多部分的问题。




Chrome 中的 Gemini: 将引入新的人工智能浏览助手,帮助用户快速理解网页内容并完成任务。




开发者工具与平台更新:

Stitch:
人工智能工具,通过生成用户界面元素和代码帮助用户设计网页和移动应用前端。用户可以通过文本或图像提示创建应用界面,并获取 HTML 和 CSS 标记。

Jules: 旨在帮助开发者修复代码错误的 AI 代理,扩大了使用范围,可帮助理解复杂代码、创建拉取请求、处理待办事项和编程任务。

Wear OS 6: 为磁贴引入统一字体,支持动态主题(Pixel 手表),使应用外观更简洁。发布设计指南和 Figma 设计文件,核心是帮助开发者构建更好的自定义功能和无缝过渡效果。





Google Play: 加强 Android 开发者功能。提供处理订阅的新工具、主题页面、音频样本,以及更流畅的附加销售结账体验。电影和电视剧的“主题浏览”页面(目前仅限美国)将连接相关应用。开发者获得专门的测试和发布页面工具,以及在出现严重问题时暂停实时发布的功能。订阅管理工具升级支持多产品结账和订阅附加项一次性支付。

Android Studio: 集成新的人工智能功能,包括与 Gemini 2.5 Pro 同步推出的“Journeys”(“代理人工智能”功能)和“Agent Mode”(处理更复杂开发流程)。增强应用质量洞察面板中的“崩溃洞察”功能,由 Gemini 驱动,分析源代码以识别崩溃原因并建议修复。




战略意义与核心观点:


搜索的底层重构: 谷歌正在将搜索从一个信息查找工具转变为一个任务执行系统。用户不再是输入关键词寻找答案,而是表达目标,由 AI 系统自动理解、分拆任务、调用资源并完成执行。“搜索不再‘回答问题’后,谁还能抓住用户?”这个问题成为焦点,答案是谁能把“问答”变成“办事”。

AI 执行代理是新平台入口: Project Mariner 等代理系统的出现意味着 AI 不再只是内容工具,而是进入了“实质执行”的角色。谁能负责“理解用户目标 → 调用资源执行 → 给出结果”,谁就能接管下一个时代的产品控制权。这是一种新的“平台税”收取方式。

从“功能框”到“任务流编排”: 产品设计思维需要从构建独立功能转向编排复杂的任务流程。Google 的整套产品(Gemini 应用、AI Mode、Project Mariner、Chrome Gemini)正在重新串联用户决策链,使平台能够调度资源并自动完成任务。

AI 的具身化与环境感知: Project Astra 和 Gemini Live 表明,AI 正走出屏幕,通过摄像头和传感器理解现实世界。“它能理解你在看什么、说什么、做什么,并主动出手。”(Demis Hassabis 语)。未来的搜索入口可能是摄像头或智能眼镜,AI 能够根据视觉线索和语境提供实时、情境化的信息和帮助。Gemini 正在从一个语言模型转变为一个世界模型。

开发者面临的挑战与机遇: 随着搜索和 AI 平台逻辑的改变,开发者需要思考如何将自身产品与新的 AI 执行入口对接。谁能率先打造“任务执行入口”,谁就能成为新平台定义者。目前的挑战在于任务链重构(从点击功能转向调度目标)和调用协议联通(形成“模型 × 应用 × 权限”的统一调度机制)。


如果希望和主播建立联系/加入听友群,可加微信bonewe2004!


关于主播:


评价...

空空如也

小宇宙热门评论...
不动_TSYT
5个月前 河南
0
AI播客吗?
HD1021768l
5个月前 宁夏
0
AI 味太浓了取关
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧