节目列表: AI Odyssey - EarsOnMe - 精选播客，一听即合

本周AI快讯：英伟达剧透未来GPU，AMD MI350系列引爆台北

欢迎收听本周的 AI 资讯： 00:02 - 英伟达创始人黄仁勋在 COMPUTEX TAIPEI 的重磅演讲，宣布后三代GPU产品路线图，剧透下一代GPU芯片官网介绍 01:28 - AMD CEO在 COMPUTEX TAIPEI 宣布了新的Instinct GPU系列路线图，MI350系列登场官网介绍 02:53 - OpenAI宣布所有ChatGPT免费用户现在可以使用浏览、视觉、数据分析、文件上传和GPT等功能 03:14 - 智谱AI获得沙特阿美旗下风险投资部门 Prosperity7 的4亿美元投资，估值达到30亿美元澎湃新闻【沙特基金4亿美元重仓智谱AI，企业估值达30亿美元】 03:58 -MiniMax CEO闫俊杰做客极客公园直播间，讨论了技术与成本、开源与闭源之争、投流和产品市场的契合度等关键问题原文地址【MiniMax 闫俊杰：今天的 AI 应用都不会成为 Super App，但这不重要】 05:21 - 张小珺：2023中国大模型产业的资本故事原文地址【大模型的扑克牌：独家内幕故事】感谢您的收听，我们下期再见～

6分钟

本周AI 资讯速递：OpenAI GPT-4o、Google I/O 2024 和 Apple 新品发布

大家好，欢迎收听本期AI 资讯 00:43: OpenAI 发布 GPT-4o 05:39: Google I/O 2024发布会亮点 08:23: 苹果春季发布会 M4 闪亮登场 09:33: 字节跳动发布了豆包大模型，价格较行业便宜99.3%。感谢您的收听，我们下期再见～

10分钟

AI 快讯：超越Llama—微软Phi-3模型

Shownote 00:01 - ChatGPT Plus新功能：Memory 00:44 - 微软发布iPhone 能跑的 Phi-3 模型系列参考论文 02:34 - 微软新工具：Copilot Workspace GitHub版Devin 介绍文章 03:48 - 李飞飞的创业方向：空间智能 04:58 - XAI融资动态原文地址 05:54 - 英伟达收购AI 初创公司Run:ai 原文地址 06:17 - 出门问问在香港交易所挂牌 07:32- Anthropic推出iOS应用 08:30- Sam 在斯坦福大学的演讲原文地址 09:47 - Perplexity CTO的复盘分享视频地址以上就是本期全部内容，感谢收听，我们下期再见～

11分钟

AI快讯探索 Llama3：Meta 打造的AI革新力作

大家好，欢迎收听本期 GenAI 快讯：以下是本期摘要： 00:07 - Meta 新推出的开源大模型 Llama3，8B、70B 已开源，405B（还在训练未开源）性能逼近GPT-4 参考内容 02:01 - Dwarkesh Patel 对扎克伯格的访谈讨论Llama3 405B模型和AI开源生态系统的重要性视频地址 03:11 - Meta 的无线长文本技术，已开源论文地址 04:21 - OpenAI 更新 Assistant API 的功能，可处理高达10,000个文件 V2 技术文档更新说明 05:07 - Claude 3 Opus模型已上线Amazon Bedrock 05:54 - MiniMax发布ABAB 6.5系列模型 06:46 - 斯坦福HAI发布第七个年度AI Index报告报告地址 08:47 - Adobe将引入AI技术到Premiere Pro中，支持OpenAI的Sora和其他模型官方 sora 演示视频 09:19 - 第一AI 程序员 Devin 演示视频“造假”翻车事件光头哥逐帧分析视频 11:18 - 亚马逊人事变动，吴恩达加入董事会亚马逊官方公告 11:57 - 20VC 对 OpenAI CEO Sam 和COO Brad 的访谈 Youtube 访谈视频 12:20 - MiniMax创始人讨论其对技术和产品并重策略的看法，以及公司在大模型创业中的地位和策略以下是《晚点 LatePost》与 MiniMax 创始人闫俊杰的对话以上是本期全部内容，感谢收听，我们下期再会～

14分钟

AI快讯：马斯克的 XAI 发布 Grok1.5，微软巧妙收编 Pi 团队，Stability AI 风雨飘摇

欢迎来到 AI Odyssey。以下是AI领域的最新动态，欢迎收听！本期内容： 00:02 - XAI 公司推出大模型 Grok-1.5，特点是上下文理解和高级推理能力的提升，计划向早期测试人员和 x 平台现有用户提供；参考内容 01:15 - OpenAI 分享了 Voice Engine 的预览，能够通过输入文本和 15 秒音频样本生成自然语言，目前只在小范围内分享；参考内容 02:10 - OpenAI 的 GPT 4 似乎不再有严格的使用上限，官方提示“Usage limits may apply”； 03:44 - Sam Altman 在 Lex Fridman 的播客中谈论了 OpenAI 的内部风波、对 Musk 的批评看法、Sora 的局限性和 GPT 4 的不足；播客地址机器之心翻译版 05:24 - Business Insider 报道一些投资者对 Sam Altman 的不满；原文地址 06:09 - 微软 CEO Nadella 就科技、企业文化、个人成长和未来趋势的讨论；视频地址 07:46 - 微软向Inflection支付6.5亿美元以获得专利使用与人才团队；新闻来源 09:09 - Stability AI 的 CEO 突然宣布辞职；官方公告 10:22 - Anthropic 公司开发的 AI 语音和音乐生成工具Suno 介绍； Suno 官网 11:43 - 百度将为苹果今年发布的 iOS 和 Mac OS 提供 AI 功能； 12:17 - GTC2024 黄仁勋和 Transformer 架构的八位提出者的对话；极客中国原文 12:32 - 吴恩达教授在 deeplearning 最新课程：优化 LLM 推理系统；课程地址 12:50- YC W24 AI Starup 项目分布； Google sheet 地址 13:22 - 创业邦发布的 2023 年 AIGC 产业投资报告；文章地址 13:32 -Trustless Labs 发布的 AI + Crypto 项目介绍; 报告地址以上就是本期节目的所有资讯，感谢您的收听，我们下期再见。

13分钟

揭秘AI文生图【下】文生图模型最前沿研究——结构原理、推理加速和评估

大家好。欢迎来到 AI Odyssey。本期播客我们有幸邀请到了文生图领域内的两位专家：林之秋和李嘉琛。两位嘉宾和主播深入探讨了文生图模型的最前沿研究，涵盖了模型的结构原理、推理加速以及评估方法。此外嘉宾还分享了模型架构的细节和优化技巧，以及模型评估的挑战和解决方案。本期内容丰富，为大家提供了一次深入了解文生图模型的机会，相信本期播客能带给大家新的启发和思考。欢迎收听，期待和大家一起探索AI的奥秘。嘉宾介绍：林之秋：CMU机器人研究所四年级博士，关注vision-language model以及generative AI。Twitter: @ZhiqiuLin Jiachen Li (李嘉琛, 推特：@JiachenLi11) ：加州大学圣塔芭芭拉分校 (UCSB)三年级PhD，主攻文生图模型，机器人控制，多模态学习。Jiachen带队参加了Amazon SimBot Challenge，获得了第二名以及10w美元的奖金。本期主播： Leo Zhao: 硅谷大厂高级机器学习工程师，GenAI LLM发烧友 Shownotes： 00:34 嘉宾自我介绍 02:08 讨论文生图模型的分类：闭源模型和开源模型，以及它们的特点和区别 03:52 探讨闭源模型和开源模型在数据质量和模型架构上的差异 06:06 分析 Diffusion Model （扩散模型）的原理，包括其与 GAN（生成对抗网络）的比较和优化 09:33 解释 Stable Diffusion 模型的特点，包括在潜在空间的生成和文本条件的引入 11:44 详细介绍 Diffusion Process 的理论基础，包括随机微分方程和逆过程的概念 16:00 讨论LCM（一致性模型）在降低推理步骤和保持生成质量方面的作用 20:42 探讨生成模型的评估指标，包括对齐度、质量、人工评估和自动化指标的重要性 27:02 分析现有自动化指标的局限性，包括 CLIP Score 的问题和改进方向 33:29 探索奖励建模在引导生成模型方面的应用和挑战 38:47 讨论不同奖励模型策略对生成模型的影响及训练的挑战 44:06 探讨用于评估和改进生成模型的新方法，包括弱模型指导强模型的潜力 49:44 讨论提高生成模型文本理解能力的重要性及其在专业应用中的潜在应用 54:29 探索用于生成模型评估的新基准和方法，重点关注文本对齐 59:36 讨论合成数据在生成模型训练中的应用及潜在优势感谢收听，我们下期再会～

61分钟

揭秘AI文生图【上】文生图应用startup从0到1

欢迎收听本期 AI Odyssey，本期我们有幸邀请到了HuHu AI CEO 刘天强，一位经验丰富的连续创业者。在这期节目中，嘉宾不仅分享了他在 AI 领域的创业历程，还深入讨论了关于 AI 产品设计、用户增长策略、以及如何在竞争激烈的市场中找到立足点。无论你是 AI 领域的专业人士，还是对文生图应用充满好奇的听众，这期节目都将为你提供独到的见解和启发。欢迎收听，与我们一起探索 AI 文生图的奥秘！嘉宾介绍：刘天强：HuHu AI CEO，连续创业者。曾经创立Orbeus并被Amazon收购，后成为Amazon Rekognition的创始架构师。在创立Huhu AI前，曾经是智能家居公司Wyze的CTO (Twitter: @Tianqiang_Liu, xhs: @AI创业中的井叔）主播介绍： Leo Zhao: 硅谷大厂高级机器学习工程师，GenAI LLM发烧友产品介绍： Chat Designer Chat Designer 是HuHu AI 的第一款 AI 产品。支持从文本生成图片，包括肖像图和产品图。用户通过简单的聊天对话即可进行像素级编辑。支持修图工具进行精确调整，轻松创造个性化图像。 HuHU AI HuHu AI 为各种商业场景提供 AI 设计代理解决方案。 Shownotes * 00:32 嘉宾自我介绍，分享连续创业经历 * 02:10 Chat Designer 的独特之处 * 02:47 讨论选择生成图应用领域的原因和市场定位 * 03:44 探讨 AI 产品设计与传统产品设计的异同 * 05:02 讨论 AI 产品的不确定性和评估标准 * 06:35 分析 AI 产品的市场定位和宣传策略 * 07:30 讨论 AI 模型的不确定性 * 08:02 讨论关于加强AI生成图的控制 * 09:29 Chat Designer 的目标用户群和市场策略 * 10:54 用户增长的核心要素和流量获取 * 13:55 讨论 AI 生图应用的艺术风格和质量评估 * 16:22 讨论 AI 生图应用的速度、质量和多样性之间的平衡 * 21:02 分享产品定价策略和收费标准 * 25:03 分享用户增长策略和口碑效应 * 32:23 预测生图应用未来发展方向和产品重构计划感谢收听，我们下期再见！

39分钟

GenAI快讯：马斯克领航开源大模型Grok

欢迎来到《AI Odyssey》播客。我们将为您带来本周AI领域的最新动态，欢迎收听！以下是本期内容： 00:05 - 马斯克开源Grok-1 项目地址 github.com 01:39 - OpenAI 开源 Transformer Debugger (TDB) 工具 GitHub 链接：github.com 03:19 - OpenAI 大模型加持的 Figure 01 机器人 Demo 视频链接 04:01 - Devin：Cognition AI 团队发布的首个 AI 软件工程师 05:10 - A16Z 分享 Top100 GenAI ToC 产品原文链接 06:29 - 探索最新 AI 创业公司的 Pitch Deck 网站官网链接 07:26 - Yann LeCun 在 Lex Fridman 播客中的专访内容视频链接 09:21 - 张小珺对王小川的采访王小川想提出中国AGI第三种可能性感谢收听本期播客，更多精彩内容，请持续关注我们的节目。下期再见！

10分钟

3k+

GenAI快讯：揭秘马斯克诉讼OpenAI，Claude 3震撼发布

欢迎来到《AI Odyssey》播客。我们将为您带来本周AI领域的最新动态，欢迎收听！以下是本期内容： 00:49 - 马斯克对OpenAI的诉讼及其影响外媒链接 01:16 - OpenAI回应马斯克诉讼，公开过去8 年的邮件沟通记录公开链接：openai.com 01:54 - OpenAI就CEO被罢免事件的调查结果，Sam重返董事 03:22 - Anthropic发布新的AI模型系列Claude 3 42 页的技术报告《The Claude 3 Model Family: Opus, Sonnet, Haiku》 04:00 - Claude 3 Opus模型具有自我认知 05:10 - 前 Google 工程师，AI 创业心路历程分享原文链接：www.yitay.net 07:36 - 张小珺对杨植麟和朱啸虎的专访月之暗面杨植麟专访：AI不是接下来一两年找到PMF，而是接下来十到二十年如何改变世界朱啸虎讲了一个中国现实主义AIGC故事 08:12 - Mini Max融资6 亿美元感谢您的收听，我们下期再见～

8分钟

3k+

GenAI快讯系列-第 7 期：Sora解密

欢迎来到《AI Odyssey》播客。我们将为您带来本周AI领域的最新动态，欢迎收听！以下是本期内容： 00:08 - Sora模型介绍 00:33 - Sora的技术优势以及其扩散模型和Transformer架构的特点 01:27 - Sora在社交媒体上的影响 02:05 - 扩散模型的原理与应用论文地址 02:47 - Sora模型的几何一致性分析论文地址 03:43 - Sora的发展前景 04:46 - OpenAI与纽约时报版权争议文件链接 05:57 - 谷歌Gemma模型介绍 07:00 - Gemini模型因种族偏见问题受到的批评和紧急关闭事件 08:04 - Meta 计划在 7 约发布 LLaMa 3 模型 08:47 - Klarna公司采用OpenAI的AI客服系统的表现和业务影响 09:48 - 中信证券的AI投资指南原文地址以上就是我们这期节目的要点摘要，详细内容请收听完整播客。我们下期节目再会。

10分钟

对话Lepton AI产品负责人：探索AI基础设施的设计与技术哲学

【主播的话】大家好，新年快乐！农历新年的第一期节目，我们有幸邀请到 Lepton AI 的产品负责人鱼哲。他将与我们深入探讨 AI 基础设施领域的最新动态和未来趋势。嘉宾不仅是一位从开发者转型为产品经理的 AI 行业专家，还曾负责高性能 AI 计算架构平台的工作，对 AI 应用层开发者的需求有着深刻的理解。在本期节目中，我们将聚焦于 AI Infra 的核心挑战，探讨如何通过产品和技术的融合提升 AI 应用的性能和效率。嘉宾还将分享他对多模态模型、结构化输出以及 AI 应用开发者需求的独到见解。本期节目为我们探索 AI Infra 的重要一步，我们将继续带来更多深入的解析和讨论。嘉宾和主播长期在北美工作生活，夹杂英文在所难免，不接受抱怨！Enjoy! 【本期嘉宾】 Yuze 鱼哲，毕业于美国伦斯勒理工大学。前阿里云高性能AI平台产品负责人。专注于AI在金融量化，风控，搜索推荐，自动驾驶，互联网娱乐等行业落地及应用。目前在北美明星AI架构平台Lepton AI 就任产品负责人。推特 @YuzeMa5。【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师，GenAI LLM发烧友【本期焦点】 01:56 AI Infra 的目标用户和需求分析 03:45 AI 应用开发者的特点和需求 06:21 AI 应用开发的路径和挑战 08:25 AI Infra 的覆盖面和优化方向 10:10 具体案例讨论：动画片分镜制作的 AI 应用 13:44 AI 模型的可扩展性和后端服务的挑战 15:28 AI 推理方向的技术探讨 18:53 AI 性能优化的具体方法和案例 22:51 AI 模型的定制化开发和技术选择 27:12 RAG 在 AI 应用中的挑战 32:30 AI 模型推理的优化方向和实践 38:01 AI 模型推理的算法和硬件优化 42:36 AI 应用开发的优化策略和业务取舍 47:20 Lepton AI 的收费模式和用户成本 51:04 AI 应用开发的未来趋势和发展方向

62分钟

2k+