节目列表: 跨国串门儿计划 - EarsOnMe

跨国串门儿计划

📝 本期播客简介本期克隆了 Nov 21, 2025 的 Nano Banana Pro 的直播发布会！本期节目中，我们将深入探索 Nano Banana Pro 这一全新图像生成模型的强大功能和创新应用。从令人惊叹的文本渲染能力，到多模态输入和高分辨率输出，Nano Banana Pro 不仅能将你的朋友变成漫画英雄，还能为你的商业品牌设计专业视觉稿。我们还将探讨模型如何利用谷歌搜索获取实时信息，以及它在教育、游戏和专业设计领域的无限潜力。加入我们，一起见证 AI 图像生成的新纪元，看看 Nano Banana Pro 将如何改变你的创作和工作方式！ 👨‍⚕️ 本期嘉宾 Logan：主持人 Nana b：Nano Banana 模型团队成员 Ammar：Nano Banana 模型团队成员 Kat：Nano Banana 模型团队成员 Nicole：生成式媒体项目首席产品经理 Tulsi Doshi：模型团队负责人 ⏱️ 时间戳 00:00 开场 & 播客简介 Nano Banana Pro 核心功能与演示 00:27 文本渲染与角色一致性：将朋友变成漫画英雄 00:36 文本渲染能力：在各种场景中实现惊人的细节和准确性 00:46 角色一致性：将自己和朋友放入自定义漫画故事 00:51 漫画生成演示：Amy 和 Sasha 拯救世界 01:26 小说模式：利用文本渲染能力创作漫画书 08:31 漫画生成结果展示：Sasha 和 Amy 在谷歌办公室修复发布问题 09:46 互动故事线：选择故事走向，驱动剧情发展 02:28 Nano Banana Pro 模型概览 02:28 为专业人士和普通创作者赋能 02:45 多语言文本渲染：支持多种语言，完美处理连字 03:07 强大的推理能力：基于 Gemini 三 Pro，可调用搜索获取最新知识 03:28 卓越的设计感：适用于信息图、视觉稿、幻灯片等 03:32 视觉设计能力与多模态输入 03:32 平面设计师的福音：听取用户反馈，扩展多模态输入窗口 03:51 14个输入：改变游戏规则，保证角色高度一致性 04:03 拓展能力边界：支持2K、4K分辨率及各种宽高比 04:40 跨平台使用：可在 AI Design、Figma 等平台创作 05:04 商业品牌设计演示：从牙膏到咖啡豆 05:04 品牌创建：使用 Gemini 三 Pro 快速生成品牌概念 06:16 牙膏品牌设计：Nano Banana Pro 生成高质量模型和 Logo 06:43 营销活动潜力：本地化、翻译等功能 07:12 多语言翻译：西班牙语牙膏标签，保持企业风格 07:33 分辨率调节：4K、1K、2K、4K选项 11:13 实时信息与游戏角色生成 11:13 调用谷歌搜索：获取最新信息，生成游戏角色总览 11:31 游戏角色生成演示：Logan 的技能、任务与风格化图片 13:49 物品栏与技能：展示 Logan 的“功能需求”和“至日权杖” 15:03 视频转图文教程与信息可视化 15:03 视频转教程：将 YouTube 视频转化为五步图文解释 15:17 发布说明视频演示：反重力平台操作指南 16:47 4K分辨率的由来：用户反馈驱动，模型迭代 17:27 信息可视化：模型在可视化信息方面的潜力 17:43 文本渲染的重要性 17:43 图像生成质量基准：文本渲染是衡量模型精细细节处理能力的关键 18:24 “小脸问题”：模型在处理微小细节时的挑战 18:49 非英语语言的显著进步：捷克语、乌尔都语等 20:06 视频转教程结果：反重力平台操作指南 20:06 分步教程：从视频中提取内容，生成操作指南 20:45 狗狗版爱彼迎：Varun 的副业，AI 智能体查看狗狗 21:12 细节到位：让理解复杂概念变得容易 22:13 创意卡通画与摄影构图分析 22:13 飞机安全须知卡片风格卡通画：Ammar 抢会议室的故事 23:22 风格控制能力：模型对特定风格的精准把握 23:45 摄影构图分析：上传照片，分析构图并提供优化建议 24:23 模型一致性：在调整构图时保持建筑和景色一致性 25:55 多语言美食菜单演示 25:55 巴基斯坦菜肴菜单：乌尔都语标注，完美处理连字 27:17 翻译与推理：将菜单翻译成西班牙语，保留不可翻译的词汇 28:02 推理能力：模型对真实性的表达和编辑能力 28:55 模型思考摘要与推理能力 28:55 “思考摘要”功能：展示模型思考过程 29:08 复杂提示处理：交换衣服、满杯红酒、国际象棋开局可视化 30:08 菜单价格与地理位置：利用世界知识生成湾区价格菜单 31:08 信息图与职业生涯可视化 31:08 F1 比赛信息图 31:17 Logan 的职业生涯可视化：皮克斯风格，参考谷歌搜索结果 32:25 巴基斯坦菜肴菜单：湾区价格，现代风格，插图 33:54 提示词的灵活性 33:54 简化提示：从冗长提示到简单指令 34:22 论文摘要：将论文转化为情况说明书 34:37 4K 壁纸生成器 34:37 用户需求：KIC 想要 4K 壁纸生成器 35:33 4K 验证：下载文件大小确认分辨率 35:53 示例：巨大的香蕉漂浮在太空中的电影风格壁纸 36:17 生成速度：Pro 模型速度快，4K 分辨率略有延迟 36:58 1K、2K、4K 的区别：数据量和细节呈现 38:21 袋熊信息图 38:21 可爱的袋熊：展示袋熊的栖息地和行为 38:40 细节：袋熊用屁股堵住隧道入口躲避捕食者 40:04 4K 壁纸生成结果 40:04 桌面壁纸：电影效果，光影细节 40:30 手机壁纸：Pixel 手机新壁纸，边缘细节 41:03 教育与学习应用 41:03 心脏图表：点击解释左心室，生成新例子 41:03 视觉化学习：将复杂概念转化为直观图像 41:33 模型团队负责人访谈 (Tulsi Doshi) 41:33 发布周回顾：Gemini 三和 Nano Banana Pro 发布 41:55 团队努力：从模型开发到发布，确保用户体验 43:32 持续进步：在 Gemini 三和 Nano Banana Pro 方面的进展 43:50 TPU 资源与商业模式 43:50 TPU 资源：持续的努力和投资 44:05 商业模式：牙膏、咖啡馆、狗狗版爱彼迎等投资机会 45:05 每日 Gemini 报纸生成器 45:05 新闻条目：利用谷歌搜索，生成相关新闻和插图 46:33 实时信息：从博客和文章中获取信息，生成报纸内容 46:48 图片编辑：将谷歌办公室覆盖上香蕉 48:06 可视化菜单应用 48:06 菜单可视化：上传菜单描述，生成带图片的新版本 49:13 真实性担忧：模型生成的食物图片过于美味 49:57 搜索事实核查：结合搜索结果，提供准确信息 50:27 Gemini 模型与搜索互动改进 50:27 自然融入：模型行为更一致，搜索结果更自然 50:50 实时信息：Gemini 应用的关键部分，扩展到图像生成 51:11 丰富图像：引入真实内容，创建丰富图像 51:46 城堡空间理解与信息情境化 51:46 真实城堡：基于对城堡的理解，展示空间理解和维度 52:33 平面图重制：用 Nano Banana Pro 重新混合平面图 53:11 信息情境化：将产品需求文档转化为信息图 53:47 发布日历可视化 53:47 Josh Woodward 的案例：将发布日历转化为视觉图 54:00 文档可视化需求 54:00 文档优先用户：希望制作可视化内容，简化执行摘要 54:35 幻灯片集成：Nano Banana Pro 与幻灯片同步发布 54:49 画廊更新与游戏创作 54:49 画廊更新：新增20个应用示例，包括14个Gemini 三和6个Nano Banana 55:18 游戏创作：酷炫有趣的游戏生成，像素化英雄与反派 56:32 游戏演示：Dutch 对抗 Mammon 的街机游戏 57:14 游戏生成改进：透明背景、精灵图创作 57:42 模型可用性 57:42 API 付费用户：可在 AI Studio 中使用 API 密钥 57:58 Gemini 应用免费用户：可在思考模式下免费使用 58:22 平面图生成结果 58:22 渲染成家：车库、主卧、二楼等区域 59:06 细节与连通性：门、浴室、走廊等布局 01:00:27 模型选择指南 01:00:27 “找到你的香蕉”：根据目标选择合适的模型 01:01:05 Nano Banana Pro：高质量、高分辨率、精确文本渲染 01:01:30 下一步：分割、精确编辑、易于访问、快速使用 01:02:40 教育与学习的未来 01:02:40 视觉化学习：将 T P U 和 G P U 对比等复杂概念转化为视觉图 01:03:09 主动生成图像：推动视觉旅程向前发展 01:03:33 AI Studio 与比较模式 01:03:33 智能体模型选择：AI Studio 智能体自动选择 Pro 或 Nano Banana 01:03:48 Playground 比较模式：并排查看 Nano Banana 和 Pro 模型输出 01:03:56 结束语 01:03:56 发布日快乐：感谢团队和用户 01:04:06 社区互动：在 X 上@nano banana，分享创作 01:04:13 反馈：欢迎提供反馈 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight ```

70分钟

1k+

5个月前

#350.AI如何改变软件工程——Martin Fowler专访

#349.产品经理的终结？为什么 LinkedIn 正在将 PMs 转变为 AI 驱动的“全栈构建者”

#348.a16z成长投资合伙人David George：构建AI投资帝国，洞察未来科技格局

#347.黄仁勋：从贫困移民到AI芯片巨头，穿越数次生死危机的传奇人生

#346.OpenAI首席研究官Mark Chen：AI前沿、人才之战与AGI的未来

#345.揭秘女性健康盲区：PCOS、子宫内膜异位症、生育与乳腺癌的真相与自救指南

#344.马斯克：创造多于索取，AI时代的财富与哲学

#343.AI学习工具NoteBookLM：是利器还是幻觉？

#342.AI 前沿：Transformer 发明人揭秘推理模型与 AI 持续指数级增长

#341.AI前沿：兴奋与恐惧交织，教育界如何迎接认知革命

#340.：对话李飞飞与Justin Johnson:超越语言模型，构建理解三维世界的AI新前沿

#339.Nano Banana Pro 发布会：图像生成新纪元，从漫画到商业设计

加入我们的 Discord

扫描微信二维码

播放列表

跨国串门儿计划 - 节目列表