时长:
70分钟
播放:
1,404
发布:
1周前
主播...
简介...
📝 本期播客简介
本期克隆了 Nov 21, 2025 的 Nano Banana Pro 的直播发布会!本期节目中,我们将深入探索 Nano Banana Pro 这一全新图像生成模型的强大功能和创新应用。从令人惊叹的文本渲染能力,到多模态输入和高分辨率输出,Nano Banana Pro 不仅能将你的朋友变成漫画英雄,还能为你的商业品牌设计专业视觉稿。我们还将探讨模型如何利用谷歌搜索获取实时信息,以及它在教育、游戏和专业设计领域的无限潜力。加入我们,一起见证 AI 图像生成的新纪元,看看 Nano Banana Pro 将如何改变你的创作和工作方式!
👨⚕️ 本期嘉宾
Logan:主持人
Nana b:Nano Banana 模型团队成员
Ammar:Nano Banana 模型团队成员
Kat:Nano Banana 模型团队成员
Nicole:生成式媒体项目首席产品经理
Tulsi Doshi:模型团队负责人
⏱️ 时间戳
00:00 开场 & 播客简介
Nano Banana Pro 核心功能与演示
00:27 文本渲染与角色一致性:将朋友变成漫画英雄
00:36 文本渲染能力:在各种场景中实现惊人的细节和准确性
00:46 角色一致性:将自己和朋友放入自定义漫画故事
00:51 漫画生成演示:Amy 和 Sasha 拯救世界
01:26 小说模式:利用文本渲染能力创作漫画书
08:31 漫画生成结果展示:Sasha 和 Amy 在谷歌办公室修复发布问题
09:46 互动故事线:选择故事走向,驱动剧情发展
02:28 Nano Banana Pro 模型概览
02:28 为专业人士和普通创作者赋能
02:45 多语言文本渲染:支持多种语言,完美处理连字
03:07 强大的推理能力:基于 Gemini 三 Pro,可调用搜索获取最新知识
03:28 卓越的设计感:适用于信息图、视觉稿、幻灯片等
03:32 视觉设计能力与多模态输入
03:32 平面设计师的福音:听取用户反馈,扩展多模态输入窗口
03:51 14个输入:改变游戏规则,保证角色高度一致性
04:03 拓展能力边界:支持2K、4K分辨率及各种宽高比
04:40 跨平台使用:可在 AI Design、Figma 等平台创作
05:04 商业品牌设计演示:从牙膏到咖啡豆
05:04 品牌创建:使用 Gemini 三 Pro 快速生成品牌概念
06:16 牙膏品牌设计:Nano Banana Pro 生成高质量模型和 Logo
06:43 营销活动潜力:本地化、翻译等功能
07:12 多语言翻译:西班牙语牙膏标签,保持企业风格
07:33 分辨率调节:4K、1K、2K、4K选项
11:13 实时信息与游戏角色生成
11:13 调用谷歌搜索:获取最新信息,生成游戏角色总览
11:31 游戏角色生成演示:Logan 的技能、任务与风格化图片
13:49 物品栏与技能:展示 Logan 的“功能需求”和“至日权杖”
15:03 视频转图文教程与信息可视化
15:03 视频转教程:将 YouTube 视频转化为五步图文解释
15:17 发布说明视频演示:反重力平台操作指南
16:47 4K分辨率的由来:用户反馈驱动,模型迭代
17:27 信息可视化:模型在可视化信息方面的潜力
17:43 文本渲染的重要性
17:43 图像生成质量基准:文本渲染是衡量模型精细细节处理能力的关键
18:24 “小脸问题”:模型在处理微小细节时的挑战
18:49 非英语语言的显著进步:捷克语、乌尔都语等
20:06 视频转教程结果:反重力平台操作指南
20:06 分步教程:从视频中提取内容,生成操作指南
20:45 狗狗版爱彼迎:Varun 的副业,AI 智能体查看狗狗
21:12 细节到位:让理解复杂概念变得容易
22:13 创意卡通画与摄影构图分析
22:13 飞机安全须知卡片风格卡通画:Ammar 抢会议室的故事
23:22 风格控制能力:模型对特定风格的精准把握
23:45 摄影构图分析:上传照片,分析构图并提供优化建议
24:23 模型一致性:在调整构图时保持建筑和景色一致性
25:55 多语言美食菜单演示
25:55 巴基斯坦菜肴菜单:乌尔都语标注,完美处理连字
27:17 翻译与推理:将菜单翻译成西班牙语,保留不可翻译的词汇
28:02 推理能力:模型对真实性的表达和编辑能力
28:55 模型思考摘要与推理能力
28:55 “思考摘要”功能:展示模型思考过程
29:08 复杂提示处理:交换衣服、满杯红酒、国际象棋开局可视化
30:08 菜单价格与地理位置:利用世界知识生成湾区价格菜单
31:08 信息图与职业生涯可视化
31:08 F1 比赛信息图
31:17 Logan 的职业生涯可视化:皮克斯风格,参考谷歌搜索结果
32:25 巴基斯坦菜肴菜单:湾区价格,现代风格,插图
33:54 提示词的灵活性
33:54 简化提示:从冗长提示到简单指令
34:22 论文摘要:将论文转化为情况说明书
34:37 4K 壁纸生成器
34:37 用户需求:KIC 想要 4K 壁纸生成器
35:33 4K 验证:下载文件大小确认分辨率
35:53 示例:巨大的香蕉漂浮在太空中的电影风格壁纸
36:17 生成速度:Pro 模型速度快,4K 分辨率略有延迟
36:58 1K、2K、4K 的区别:数据量和细节呈现
38:21 袋熊信息图
38:21 可爱的袋熊:展示袋熊的栖息地和行为
38:40 细节:袋熊用屁股堵住隧道入口躲避捕食者
40:04 4K 壁纸生成结果
40:04 桌面壁纸:电影效果,光影细节
40:30 手机壁纸:Pixel 手机新壁纸,边缘细节
41:03 教育与学习应用
41:03 心脏图表:点击解释左心室,生成新例子
41:03 视觉化学习:将复杂概念转化为直观图像
41:33 模型团队负责人访谈 (Tulsi Doshi)
41:33 发布周回顾:Gemini 三和 Nano Banana Pro 发布
41:55 团队努力:从模型开发到发布,确保用户体验
43:32 持续进步:在 Gemini 三和 Nano Banana Pro 方面的进展
43:50 TPU 资源与商业模式
43:50 TPU 资源:持续的努力和投资
44:05 商业模式:牙膏、咖啡馆、狗狗版爱彼迎等投资机会
45:05 每日 Gemini 报纸生成器
45:05 新闻条目:利用谷歌搜索,生成相关新闻和插图
46:33 实时信息:从博客和文章中获取信息,生成报纸内容
46:48 图片编辑:将谷歌办公室覆盖上香蕉
48:06 可视化菜单应用
48:06 菜单可视化:上传菜单描述,生成带图片的新版本
49:13 真实性担忧:模型生成的食物图片过于美味
49:57 搜索事实核查:结合搜索结果,提供准确信息
50:27 Gemini 模型与搜索互动改进
50:27 自然融入:模型行为更一致,搜索结果更自然
50:50 实时信息:Gemini 应用的关键部分,扩展到图像生成
51:11 丰富图像:引入真实内容,创建丰富图像
51:46 城堡空间理解与信息情境化
51:46 真实城堡:基于对城堡的理解,展示空间理解和维度
52:33 平面图重制:用 Nano Banana Pro 重新混合平面图
53:11 信息情境化:将产品需求文档转化为信息图
53:47 发布日历可视化
53:47 Josh Woodward 的案例:将发布日历转化为视觉图
54:00 文档可视化需求
54:00 文档优先用户:希望制作可视化内容,简化执行摘要
54:35 幻灯片集成:Nano Banana Pro 与幻灯片同步发布
54:49 画廊更新与游戏创作
54:49 画廊更新:新增20个应用示例,包括14个Gemini 三和6个Nano Banana
55:18 游戏创作:酷炫有趣的游戏生成,像素化英雄与反派
56:32 游戏演示:Dutch 对抗 Mammon 的街机游戏
57:14 游戏生成改进:透明背景、精灵图创作
57:42 模型可用性
57:42 API 付费用户:可在 AI Studio 中使用 API 密钥
57:58 Gemini 应用免费用户:可在思考模式下免费使用
58:22 平面图生成结果
58:22 渲染成家:车库、主卧、二楼等区域
59:06 细节与连通性:门、浴室、走廊等布局
01:00:27 模型选择指南
01:00:27 “找到你的香蕉”:根据目标选择合适的模型
01:01:05 Nano Banana Pro:高质量、高分辨率、精确文本渲染
01:01:30 下一步:分割、精确编辑、易于访问、快速使用
01:02:40 教育与学习的未来
01:02:40 视觉化学习:将 T P U 和 G P U 对比等复杂概念转化为视觉图
01:03:09 主动生成图像:推动视觉旅程向前发展
01:03:33 AI Studio 与比较模式
01:03:33 智能体模型选择:AI Studio 智能体自动选择 Pro 或 Nano Banana
01:03:48 Playground 比较模式:并排查看 Nano Banana 和 Pro 模型输出
01:03:56 结束语
01:03:56 发布日快乐:感谢团队和用户
01:04:06 社区互动:在 X 上@nano banana,分享创作
01:04:13 反馈:欢迎提供反馈
🌐 播客信息补充
本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的
使用 AI 进行翻译,因此可能会有一些地方不通顺;
如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
```
本期克隆了 Nov 21, 2025 的 Nano Banana Pro 的直播发布会!本期节目中,我们将深入探索 Nano Banana Pro 这一全新图像生成模型的强大功能和创新应用。从令人惊叹的文本渲染能力,到多模态输入和高分辨率输出,Nano Banana Pro 不仅能将你的朋友变成漫画英雄,还能为你的商业品牌设计专业视觉稿。我们还将探讨模型如何利用谷歌搜索获取实时信息,以及它在教育、游戏和专业设计领域的无限潜力。加入我们,一起见证 AI 图像生成的新纪元,看看 Nano Banana Pro 将如何改变你的创作和工作方式!
👨⚕️ 本期嘉宾
Logan:主持人
Nana b:Nano Banana 模型团队成员
Ammar:Nano Banana 模型团队成员
Kat:Nano Banana 模型团队成员
Nicole:生成式媒体项目首席产品经理
Tulsi Doshi:模型团队负责人
⏱️ 时间戳
00:00 开场 & 播客简介
Nano Banana Pro 核心功能与演示
00:27 文本渲染与角色一致性:将朋友变成漫画英雄
00:36 文本渲染能力:在各种场景中实现惊人的细节和准确性
00:46 角色一致性:将自己和朋友放入自定义漫画故事
00:51 漫画生成演示:Amy 和 Sasha 拯救世界
01:26 小说模式:利用文本渲染能力创作漫画书
08:31 漫画生成结果展示:Sasha 和 Amy 在谷歌办公室修复发布问题
09:46 互动故事线:选择故事走向,驱动剧情发展
02:28 Nano Banana Pro 模型概览
02:28 为专业人士和普通创作者赋能
02:45 多语言文本渲染:支持多种语言,完美处理连字
03:07 强大的推理能力:基于 Gemini 三 Pro,可调用搜索获取最新知识
03:28 卓越的设计感:适用于信息图、视觉稿、幻灯片等
03:32 视觉设计能力与多模态输入
03:32 平面设计师的福音:听取用户反馈,扩展多模态输入窗口
03:51 14个输入:改变游戏规则,保证角色高度一致性
04:03 拓展能力边界:支持2K、4K分辨率及各种宽高比
04:40 跨平台使用:可在 AI Design、Figma 等平台创作
05:04 商业品牌设计演示:从牙膏到咖啡豆
05:04 品牌创建:使用 Gemini 三 Pro 快速生成品牌概念
06:16 牙膏品牌设计:Nano Banana Pro 生成高质量模型和 Logo
06:43 营销活动潜力:本地化、翻译等功能
07:12 多语言翻译:西班牙语牙膏标签,保持企业风格
07:33 分辨率调节:4K、1K、2K、4K选项
11:13 实时信息与游戏角色生成
11:13 调用谷歌搜索:获取最新信息,生成游戏角色总览
11:31 游戏角色生成演示:Logan 的技能、任务与风格化图片
13:49 物品栏与技能:展示 Logan 的“功能需求”和“至日权杖”
15:03 视频转图文教程与信息可视化
15:03 视频转教程:将 YouTube 视频转化为五步图文解释
15:17 发布说明视频演示:反重力平台操作指南
16:47 4K分辨率的由来:用户反馈驱动,模型迭代
17:27 信息可视化:模型在可视化信息方面的潜力
17:43 文本渲染的重要性
17:43 图像生成质量基准:文本渲染是衡量模型精细细节处理能力的关键
18:24 “小脸问题”:模型在处理微小细节时的挑战
18:49 非英语语言的显著进步:捷克语、乌尔都语等
20:06 视频转教程结果:反重力平台操作指南
20:06 分步教程:从视频中提取内容,生成操作指南
20:45 狗狗版爱彼迎:Varun 的副业,AI 智能体查看狗狗
21:12 细节到位:让理解复杂概念变得容易
22:13 创意卡通画与摄影构图分析
22:13 飞机安全须知卡片风格卡通画:Ammar 抢会议室的故事
23:22 风格控制能力:模型对特定风格的精准把握
23:45 摄影构图分析:上传照片,分析构图并提供优化建议
24:23 模型一致性:在调整构图时保持建筑和景色一致性
25:55 多语言美食菜单演示
25:55 巴基斯坦菜肴菜单:乌尔都语标注,完美处理连字
27:17 翻译与推理:将菜单翻译成西班牙语,保留不可翻译的词汇
28:02 推理能力:模型对真实性的表达和编辑能力
28:55 模型思考摘要与推理能力
28:55 “思考摘要”功能:展示模型思考过程
29:08 复杂提示处理:交换衣服、满杯红酒、国际象棋开局可视化
30:08 菜单价格与地理位置:利用世界知识生成湾区价格菜单
31:08 信息图与职业生涯可视化
31:08 F1 比赛信息图
31:17 Logan 的职业生涯可视化:皮克斯风格,参考谷歌搜索结果
32:25 巴基斯坦菜肴菜单:湾区价格,现代风格,插图
33:54 提示词的灵活性
33:54 简化提示:从冗长提示到简单指令
34:22 论文摘要:将论文转化为情况说明书
34:37 4K 壁纸生成器
34:37 用户需求:KIC 想要 4K 壁纸生成器
35:33 4K 验证:下载文件大小确认分辨率
35:53 示例:巨大的香蕉漂浮在太空中的电影风格壁纸
36:17 生成速度:Pro 模型速度快,4K 分辨率略有延迟
36:58 1K、2K、4K 的区别:数据量和细节呈现
38:21 袋熊信息图
38:21 可爱的袋熊:展示袋熊的栖息地和行为
38:40 细节:袋熊用屁股堵住隧道入口躲避捕食者
40:04 4K 壁纸生成结果
40:04 桌面壁纸:电影效果,光影细节
40:30 手机壁纸:Pixel 手机新壁纸,边缘细节
41:03 教育与学习应用
41:03 心脏图表:点击解释左心室,生成新例子
41:03 视觉化学习:将复杂概念转化为直观图像
41:33 模型团队负责人访谈 (Tulsi Doshi)
41:33 发布周回顾:Gemini 三和 Nano Banana Pro 发布
41:55 团队努力:从模型开发到发布,确保用户体验
43:32 持续进步:在 Gemini 三和 Nano Banana Pro 方面的进展
43:50 TPU 资源与商业模式
43:50 TPU 资源:持续的努力和投资
44:05 商业模式:牙膏、咖啡馆、狗狗版爱彼迎等投资机会
45:05 每日 Gemini 报纸生成器
45:05 新闻条目:利用谷歌搜索,生成相关新闻和插图
46:33 实时信息:从博客和文章中获取信息,生成报纸内容
46:48 图片编辑:将谷歌办公室覆盖上香蕉
48:06 可视化菜单应用
48:06 菜单可视化:上传菜单描述,生成带图片的新版本
49:13 真实性担忧:模型生成的食物图片过于美味
49:57 搜索事实核查:结合搜索结果,提供准确信息
50:27 Gemini 模型与搜索互动改进
50:27 自然融入:模型行为更一致,搜索结果更自然
50:50 实时信息:Gemini 应用的关键部分,扩展到图像生成
51:11 丰富图像:引入真实内容,创建丰富图像
51:46 城堡空间理解与信息情境化
51:46 真实城堡:基于对城堡的理解,展示空间理解和维度
52:33 平面图重制:用 Nano Banana Pro 重新混合平面图
53:11 信息情境化:将产品需求文档转化为信息图
53:47 发布日历可视化
53:47 Josh Woodward 的案例:将发布日历转化为视觉图
54:00 文档可视化需求
54:00 文档优先用户:希望制作可视化内容,简化执行摘要
54:35 幻灯片集成:Nano Banana Pro 与幻灯片同步发布
54:49 画廊更新与游戏创作
54:49 画廊更新:新增20个应用示例,包括14个Gemini 三和6个Nano Banana
55:18 游戏创作:酷炫有趣的游戏生成,像素化英雄与反派
56:32 游戏演示:Dutch 对抗 Mammon 的街机游戏
57:14 游戏生成改进:透明背景、精灵图创作
57:42 模型可用性
57:42 API 付费用户:可在 AI Studio 中使用 API 密钥
57:58 Gemini 应用免费用户:可在思考模式下免费使用
58:22 平面图生成结果
58:22 渲染成家:车库、主卧、二楼等区域
59:06 细节与连通性:门、浴室、走廊等布局
01:00:27 模型选择指南
01:00:27 “找到你的香蕉”:根据目标选择合适的模型
01:01:05 Nano Banana Pro:高质量、高分辨率、精确文本渲染
01:01:30 下一步:分割、精确编辑、易于访问、快速使用
01:02:40 教育与学习的未来
01:02:40 视觉化学习:将 T P U 和 G P U 对比等复杂概念转化为视觉图
01:03:09 主动生成图像:推动视觉旅程向前发展
01:03:33 AI Studio 与比较模式
01:03:33 智能体模型选择:AI Studio 智能体自动选择 Pro 或 Nano Banana
01:03:48 Playground 比较模式:并排查看 Nano Banana 和 Pro 模型输出
01:03:56 结束语
01:03:56 发布日快乐:感谢团队和用户
01:04:06 社区互动:在 X 上@nano banana,分享创作
01:04:13 反馈:欢迎提供反馈
🌐 播客信息补充
本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的
使用 AI 进行翻译,因此可能会有一些地方不通顺;
如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
```
评价...
空空如也
小宇宙热门评论...
子洋Eric
6天前
北京
1
48:22 啥啊这是
洪魔
6天前
上海
1
这是机器人聊天吗?
子洋Eric
6天前
北京
1
48:22 啥啊这是
洪魔
6天前
上海
1
这是机器人聊天吗?
Tommilee
6天前
新西兰
0
语气很像robot
子洋Eric
6天前
北京
0
47:33 这啥情况啊,乱入了
Tenth
3天前
浙江
0
48:30 这一段乱入了
Tommilee
6天前
新西兰
0
语气很像robot
子洋Eric
6天前
北京
0
47:33 这啥情况啊,乱入了
Tenth
3天前
浙江
0
48:30 这一段乱入了