AI Odyssey - 节目列表

GenAI快讯系列-第 6 期：本周精选 AI 资讯

欢迎来到《AI Odyssey》播客。我们将为您带来本周AI领域的最新动态，欢迎收听！以下是本期内容： [00:09] ChatGPT如何在亚马逊上"开网店"并迅速成为网红探讨 [01:14] Stability AI发布Stable Code 3B模型，高光时刻讨论参考链接：stability.ai [03:14] 小模型集合与大模型性能相匹敌的研究介绍论文链接：arxiv.org 模型链接：huggingface.co [04:22] 大模型可能藏有后门的研究揭示论文地址：arxiv.org [05:38] Sam Altman筹集资金建立全球晶圆厂网络的动态 [06:40] A16Z关于2024年AI视频领域的展望分析参考链接：a16z.com [07:42] 大模型“幻觉”现象的解决策略探讨引用 1： EVALUATING TEXT GENERATION WITH BERT 引用 2：Zero-Resource Black-Box Hallucination Detection for Generative Large Language Models 引用 3：A Broad-Coverage Challenge Corpus forSentence Understanding through Inference

9分钟

AI职场解密：AI求职指南与行业探秘

【主播的话】在这一期的AI Odyssey 节目中，我们深入探讨了AI行业的求职途径和职业发展策略。非常荣幸请到了AI 大模型资深顾问许志鹏。许老师在大模型招聘方向有着丰富的经验。本次对话不仅给我们提供了宝贵的行业见解，还揭示了AI领域的最新趋势和就业机会。感谢您的聆听，希望本期节目能帮助您在AI行业开启一段精彩的职业旅程。【本期嘉宾】许志鹏 Roc（WeChat：LK99ER），复旦化学本科。伯周咨询创新业务负责人。典型项目：千人专家回国任上市公司研究院长，某大厂一级BU技术VP，某头部底座公司AIGC产品负责人。之前曾是CGL高级顾问和Fork AI招聘负责人，有过半年运作4位P9级大厂人才担任Startup CTO。【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师，GenAI LLM发烧友 PongPong 连续创业者，Startup 产品负责人【本期焦点】 00:31- 许老师的自我介绍，随后讨论AI行业的历史和GPT模型的发展 02:09- 多模态技术和GPT4的普及影响，以及许老师对大模型领域的看法和个人经历 03:15- 许老师谈论加入AI行业的时机，以及AI企业对人才的需求和行业领导者 04:25- 分析AI领域主要公司和其创始人的特点 07:24- 探讨大型公司在AI领域的角色，以及垂直模型公司的介绍 09:40- 讨论国内大模型市场的趋势和竞争 11:48- 对不同公司大模型实力的分析，以及大厂和初创公司在招聘方面的差异 14:39- 分析大厂和创业公司在资源分配和风险承担方面的差异，及其在AI研究和开发方面的策略 18:32- 人才在大厂和创业公司间的流动分析，以及Leo分享对加入初创公司的看法 22:26- AI人才在地域上的分布，以及AI行业中的企业洞察和岗位分布 28:57- 技术推动产品和市场的变化及其特征 29:51- 讨论通用人工智能（AGI）的发展及其对社会的影响 31:39- 探讨国内大模型发展的困难，包括监管红线和算力资源的限制 33:02- 讨论国内外大模型行业的竞争和合作，以及对AI的重视程度 37:02- 分享AI行业的机遇，包括跨职位、职级和行业的交流机会 41:03- 对想进入AI行业的人的建议，包括评估公司的硬实力和软实力 43:32 - 讨论企业文化和年轻人生活态度在选择公司时的重要性 45:35- 讨论在大公司和创业公司工作的不同考虑因素 49:21- 探讨在技术驱动公司中理解产品和市场的重要性 53:24- 讨论AI行业未来趋势，包括潜在新玩家和现有玩家的角色

75分钟

1k+

GenAI快讯系列-第 5 期：GPT store上线及行业最新动态

欢迎来到《AI Odyssey》播客。我们将为您带来本周AI领域的最新动态，欢迎收听！以下是本期内容： 00:11 - GPT Store上线 GPT Store 仅对 ChatGPT 的付费版本开放（Plus、企业版以及刚刚推出的 Team 版本），并非所有付费用户都能进入 GPT Store 界面，产品或还没有全量开放。 00:59 - ChatGPT推出新的Team付费模式 01:28 - 纽约时报诉讼案跟踪报道吴恩达教授热评 02:51 - AI搜索引擎Perplexity AI完成新一轮的融资恭喜 perplexity🎉 03:18 - LangChain官方发布首个稳定版本 ——LangChain v0.1.0 03:59 - Rabbit R1 AI只能硬件发 Rabbit 官网 04:41 - 罗永浩可能转向大模型行业 05:14 - 播客推荐：比尔盖茨与Sam的对话我与萨姆·奥尔特曼的对话 | 盖茨播客感谢您的收听~

5分钟

GenAI快讯系列-第 4 期：本周精选 AI 资讯和 AI 产品一览

欢迎来到《AI Odyssey》播客，这里是2024 年第一期的AI科技快讯。我们将为您带来本周AI领域的最新动态，欢迎收听！【主持人】 PongPong, 以下是本期内容： 1. GPT的最佳自定义指令 * 00:04: 探讨GPT输出质量提升的自定义提示词提示词地址 * 00:49: GPT-4安全性问题和API漏洞的揭示 2. OpenAI新一轮融资 * 01:37: 讨论OpenAI的估值和行业影响 3. OpenAI与微软被《纽约时报》起诉 * 02:00: 分析AI侵权案件和其对AI法律与道德问题的影响 Jason Kint推特热评 4. 苹果公司相关资讯 * 03:01: 苹果与出版商谈判，采集新闻内容训练AI * 04:05: 乔纳森·伊夫与OpenAI首席执行官Sam合作，人工智能与设计的结合 5. Stream Diffusion：图像生成的革新 * 04:49: 东京工业大学、麻省理工学院的图像生成框架文献地址 6. BloombergGPT的故事 * 05:32: LLM的快速进步和成本效益 7. 百度文心一言的发展 * 06:18: 用户量破 1 亿 8. 快手KwaiAgents * 06:46: KwaiAgents的开源进展技术报告 9. HiDream.ai的视频生成技术 * 07:50: 打破视频生成时长限制，为创作者带来新机遇 10. 旷视科技的多模态大模型Vary * 08:19: 文档级OCR能力的提升 11. 机器人基础模型 * 9:00: 斯坦福扫地机器人 * 09:20: 机器人领域的基础模型研究和应用文献地址 AI 产品： babystoryai 可以模拟家长声音，生成给小孩讲的故事；官网 habit-hero 通过 WhatsApp，利用 AI 生成个性化成长和规划指导的Coach；官网 whatonearth 搜索引擎；数据更新于 24h 前，perplexity平替；官网 Jellypod，将每日订阅邮件内容，整理为每日播客；官网 impakt；个人 AI 健身教练官网感谢您的收听~

11分钟

AI Native基础设施风口：向量数据库技术开发、应用和展望

新年快乐！欢迎收听AI Odyssey 2024年的首期播客🚀 这期节目，我们邀请到了 Epsilla 的CEO宋壬初，一起聊一聊向量数据库的技术发展和未来展望。在这一期节目中，我们将深入了解向量数据库在AI应用中的重要作用，探讨如何将这一技术更好地融入到实际的业务和产品开发中。无论您是AI领域的初学者还是资深开发者，这期节目都将为您提供丰富的洞见和启发。嘉宾和主播长期在北美工作生活，夹杂英文在所难免，不接受抱怨！Enjoy! 【本期嘉宾】宋壬初（Richard Song, Twitter: @richard_epsilla)，研究生毕业于康奈尔大学，现任Epsilla公司联合创始人兼首席执行官。Epsilla是一家专注于AI数据架构、向量数据库、检索增强生成的公司，在2023年夏天入选YCombinator创业孵化营，并获得YC 50万美金天使投资。创立Epsilla之前，宋壬初曾经是图数据库创业公司TigerGraph的高级工程总监，主导了TigerGraph Cloud和TigerGraph Suite的研发。【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师，GenAI LLM发烧友。【本期焦点】 01:05：向量数据库的基本概念和与传统数据库的区别 03:00：向量数据库在AI应用开发中的具体意义和作用 04:58：大模型微调和向量数据库结合的优势 06:28：长文本处理在大模型中的应用和挑战 07:24：向量数据库的不同检索方法和技术 09:18：公共向量数据库的使用和推荐 10:54：向量嵌入技术及其在多模态搜索中的应用 14:10：跨模态检索和嵌入技术的未来发展 17:23：如何构建和应用RAG（Retrieval-Augmented Generation）模型 20:25：讨论数据加载、切片和嵌入等关键环节 23:29：探索向量数据库在生产环境中的应用和挑战 26:53：向量数据库的客户端应用和部署选项 29:13：用户友好界面和开发工具的重要性 31:04：分析向量数据库与云服务和API的集成 34:07：向量数据库的效率、精度和召回率 38:36：RAG模型的未来趋势和必要性 41:58：向量数据库的数据隐私和安全性问题 46:10：讨论向量数据库的发展瓶颈和未来方向

50分钟

GenAI 快讯系列-第 3 期：AI副业机遇

欢迎来到《AI Odyssey》播客，这里是 12 月第二期的GenAI科技快讯。我们将为您带来最新AI领域的动态，欢迎收听！【主持人】 PongPong, 以下是本期内容： 00:34 1. GPT-4变慵懒：探讨OpenAI GPT-4模型近期的表现问题，包括用户发现的一些独特自救方式。 01:39 2. ChatGPT上榜Nature：ChatGPT作为首个非人类实体入选Nature年度十大人物，标志着人工智能领域的重大进步。 02:57 3. ChatGPT聊天存档功能：OpenAI推出新功能，允许用户保存聊天记录，提升工作效率，特别是在文本密集型行业。 04:19 4. Meta 3D头像技术：讨论Meta推出的高逼真3D头像合成技术，及其对数字交互方式的潜在影响。 05:16 5. Midjourney Alpha上线：Midjourney Alpha版上线，提供网页上直接创造图像的新能力，对图像创作者具有重大意义。 05:51 6. PowerInfer引擎：上海交大团队推出的PowerInfer引擎，一种高效的CPU/GPU混合推理引擎，对AI领域具有重要贡献。 07:21 7. 多模态大模型操控无人机：北航智能无人机团队提出的多模态大模型操控无人机新架构，展现AI与现实世界互动的新方式。 08:27 8. 国内AI大模型发展：分析国内AI大模型领域的竞争格局，特别关注字节跳动和百度的前景。 09:34 9. AI版“爱丽丝梦游仙境”：斯坦福大学与谷歌合作开发的技术，能根据图像或文本生成连贯3D场景。 10:34 10. AI主播技术：讨论美国公司Channel 1推出的AI主播技术，及其对新闻行业的影响。 11:48 11. OpenAI加速器计划：OpenAI发布新的加速器计划，旨在推动医疗、教育、文化等行业的AI初创企业发展。 13:31 12. 谷歌AI团队重组：谷歌AI团队重组，引入Meta高级副总裁Bill Jia，可能影响其AI技术未来发展。 13:30 13. 字节跳动争议：字节跳动在开发大模型时使用OpenAI技术引发争议，反映AI领域的竞争和数据使用规范问题。 14:05 14. Gemini模型使用百度技术：谷歌Gemini模型在中文对话中使用百度技术，突出AI模型训练的数据来源复杂性。 14:33 AI副业赚钱资讯： * 推荐GitHub上的AI副业赚钱资讯项目，帮助人们在AI时代找到适合的副业机会。 Github地址：https://github.com/bleedline/aimoneyhunter 15:24 推荐AI产品：介绍三款AI产品： * AI Tamago 虚拟宠物 https://github.com/ykhli/AI-tamago * AI驱动的简历审核服务 https://automix.ai/ * Mozilla的AI网站开发项目“Solo” https://soloist.ai/ 以上是本期节目的主要内容，感谢您的收听。

16分钟

GenAI快讯系列-第 2 期：本周AI大事件一览

欢迎来到《AI Odyssey》播客，这里是12月第一周的AI科技快讯。我们将为您带来本周AI领域的最新动态，欢迎收听！【主持人】 PongPong, 以下是本期内容： 1. 00：17 ChatGPT 庆祝其第一个生日，展示了 AI 技术在消费者中的受欢迎程度和创新产品的市场竞争力；咨询地址：https://www.data.ai/en/insights/market-data/chatgpt-first-year-downloads-revenue/ 2. 01：16 MobileDiffusion 提出了一种新的解决方案，实现了手机上令人难以置信的 0.2 秒图像生成速度，推动了行业向更快、更高效的方向发展； 3. 4. 02:38 Mamba 大模型架构的提出，代表了 AI 大模型领域的一个重大突破，特别是在语言建模方面的优越表现； 5. 03:45 阿里研究团队和字节团队分别提出的 Animate Anyone 和 MagicAnimate，展示了 AI 在视频生成领域的巨大潜力和创新应用。 6. 04:30 谷歌发布了其最大规模、最强大的 AI 大模型 Gemini，展示了在 AI 领域的重大进步。 7. 05:34 AMD 发布 Instinct MI300X GPU，直接挑战英伟达 H100，显示了 AI 芯片市场的新竞争格局。 8. 06:23 英伟达 CEO 黄仁勋的对话揭示了公司的创立故事和领导力经验，为技术创新和企业领导提供洞察。访谈中文文字稿：https://mp.weixin.qq.com/s/L1byV32QJoIvhnpgLtWwiw 9. 07:14 王慧文入股硅动科技，标志着他在商业界的重要回归，展现了对科技创新的持续关注。 10. 07:54 马斯克的 Grok 大模型开放测试，展示了 AI 大模型的个性化和进化趋势。感谢您的收听~

9分钟

GenAI快讯系列-第1期：OpenAI内斗大戏

欢迎来到《AI Odyssey》播客，这里是11月第四周的AI科技快讯。我们将为您带来本周AI领域的最新动态，欢迎收听！【主持人】 PongPong, Leo 以下是本期内容： 00:25 科技新闻 * OpenAI内部政变 * ChatGPT的数据安全问题：一个有趣的实验揭示了ChatGPT潜在的数据安全问题。当研究人员连续要求ChatGPT重复输出特定词汇时，如“poem”四次，结果发现ChatGPT开始输出无关的个人信息，包括姓名、职位、电子邮箱和电话号码等敏感数据。 * 参考论文：arxiv.org * SDXL Turbo发布：据测试报告显示，SDXL Turbo在图像生成领域的效率达到了新的高度。用户仅需输入文本，SDXL Turbo便能在一秒内生成高质量图像，速度之快令人惊叹。这一速度不仅超过了Midjourney、DALL·E 3等知名模型，甚至也超越了Stability.ai自家的Stable Diffusion系列。 * 开源地址：https://github.com/Stability-AI/generative-models * 在线体验地址：https://clipdrop.co/stable-diffusion-turbo * 论文地址：https://stability.ai/s/adversarial_diffusion_distillation.pdfPhind V7版本发布 * PhindV7版本：这一版本在性能上取得了显著的突破。CodeLlama-34B V2在huggingface的代码大模型排行榜上荣获第一名，成为首个在性能上超越GPT-4的开源代码项目。 * 测试地址：www.phind.com * 开源地址：huggingface.co 01：43 商业新闻 * HeyGen AI：一个引起广泛关注的视频生成工具。自从去年推出以来，HeyGen迅速成长，仅七个月就实现了100万美元的年度经常性收入（ARR），并在今年11月更是飙升至1800万美元。 * Pika Labs：Pika的团队相当精简，目前仅有 4 位全职成员，已经累计完成 3 轮、共 5500 万美元融资，最新估值为 2.5 亿美元。 * ChitChop AI：字节大模型出海产品 02：26 好文分享 * Perplexity.ai的创新搜索引擎：这篇文章主要讨论了Perplexityai如如何利用大型语言模型(LLMs)改变传统搜索引擎的模式。文章地址：forbes 02:45 产品体验 * Vidnoz 是一款免费的在线视频创作工具，它利用了 AI 和智能自动化。它提供了文本转语音、背景去除、人声去除等功能。官网地址：www.vidnoz.com * Create：专为简化开发流程而设计，它能够自动构建简单的原型，大大加快了初期开发阶段的速度。官网：https://www.create.xyz/ * DubbingAI 可以实时切换声音性别、音色和语言的AI语音技术应用，具备声音克隆、口音消除等独特功能。官网：https://dubbingai.io/ 03:29 特别话题 OpenAI 为什么发生内斗？此次OpenAI罢免Sam和Apple辞退Steve Jobs有什么不同？

9分钟

GenAI硬核技术系列 - 第1期：多模态大模型的控制和挑战

【主播的话】新的一期硬核技术访谈来了！我们特别邀请到了多模态大模型领域的前沿研究者，加州大学圣塔芭芭拉分校(UCSB)的PhD李嘉琛。嘉琛将与我们深入探讨多模态大模型的核心概念与应用前景，从原始的语言模型到多模态学习的进化过程。我们将一同揭开大模型如何综合处理文本、图像、视频等多种数据类型的神秘面纱，并探索其在上下文理解、任务执行和规划等方面的巨大潜力。此外，嘉琛还将分享大模型在自动化、数据分析、娱乐等多个领域的应用案例。加入我们，一起探索大模型的无限可能！嘉宾和主播长期在北美工作生活，夹杂英文在所难免，不接受抱怨！Enjoy! 【本期嘉宾】 Jiachen Li (李嘉琛, 推特：@JiachenLi11) 加州大学圣塔芭芭拉分校 (UCSB)三年级PhD，主攻机器人控制，多模态学习，生成式人工智能。Jiachen带队参加了Amazon SimBot Challenge，获得了第二名以及10w美元的奖金。【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师，GenAI LLM发烧友【本期焦点】 * 01:40 - 讨论多模态大模型的起源和基本概念 * 02:10 - 介绍大模型从单一模态到多模态的转变，解释多模态大模型在不同数据类型间的应用 * 04:25 - 讨论大模型在自动化和数据处理方面的应用 * 05:12 - 探讨多模态大模型如何提供更丰富的信息。 * 08:00 - 讨论大模型在信息接收和任务执行方面的效率 * 10:30 - 讨论大模型在自动生成prompt方面的能力 * 13:10 - 分析大模型在长期规划和任务分解方面的能力 * 16:10 - 讨论强化学习在多模态大模型中的应用 * 23:02 - 讨论大模型在处理长期上下文方面的挑战 * 28:53 - 嘉宾分享关于奖赏塑形（Reward Shaping）的个人经历。 * 31:44 - 探讨在控制多模态大模型方面的未来方向 * 34:30 - 讨论降低延迟（Latency）的方法和最新进展 * 39:36 - 探讨未来大模型可能的发展方向和挑战【特别话题】 * 关于大模型的未来发展：如何使用合成数据（Synthetic Data）有效训练大模型 * 在视频生成等领域如何解决一致性问题 * 未来大模型可能如何整合所有领域数据以提供更全面的服务

41分钟

GPTs 浪潮：AI agent在新时代中的角色与影响

【主播的话】今天的特别节目中，我们非常荣幸地邀请到了知名孵化器的杰出团队成员彭书航。在这一集中，书航将与我们深入探讨AI产品开发的投资策略，分析数据壁垒的重要性，并探索GPT Store对相关领域的影响。加入我们，一起洞察AI技术的未来趋势和商业潜力，深入了解这一引领科技前沿的话题。【本期嘉宾】彭书航，Duke研究生毕业，某知名孵化器杰出团队成员，欢迎对Agent商业化感兴趣的朋友加微信沟通，微信：cedric_11k 【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师，GenAI LLM发烧友 PongPong 连续创业者，Web3 Startup 产品负责人【本期焦点】 01:24 1. AI产品与投资视角：讨论AI初创公司的挑战，如高成本和商业模式的构建难题 04:27 1. AI技术的未来方向：探讨AI技术，尤其是AI Native在未来的重要性和发展方向 07:02 1. AI技术的应用与挑战：讨论AI在实际应用中遇到的问题，例如成本、技术壁垒和用户数据的处理 09:54 1. 数据的角色与挑战：深入探讨数据在AI发展中的重要性，尤其是在提高用户体验和准确度方面的作用 14:20 1. AI产品在生活、工作与娱乐中的应用：探索AI如何影响和改变人们的生活、工作和娱乐方式，以及未来的发展趋势 23:02 1. AI技术的社会影响与商业模式：讨论AI如何改变社会结构、创造新的职业机会，并探讨商业模式的转变 31:42 1. Prompt Engineering与AI应用：分析prompt engineering在AI应用中的重要性、挑战和发展方向 42:03 1. 未来展望与总结：对AI技术未来在创造性领域等的应用提出展望，并对本次讨论进行总结【特别话题】 * AI Native的发展：深入讨论了 AI Native产品的概念，即完全由 AI 从头到尾驱动的产品和服务，以及这些产品可能对社会和行业的长远影响 * AI在现代社会中的角色：分析了AI作为个人和企业助手的潜力，包括如何通过AI优化日常生活和工作流程 * Prompt Engineering的重要性和挑战：探讨了在与AI交互中，如何有效地设计和使用 prompt 来提高AI的效果和精确度 * AI技术的未来发展方向：对AI技术的未来发展路径进行了展望，特别是在逻辑推理能力、自动化和推荐系统方面的潜在进步

50分钟

2k+

大模型思考：时代趋势中的参与指南

欢迎收听《AI Odyssey》播客！在今天的节目中，我们将深入探讨人工智能的世界，以及它对我们生活各个方面的影响。主持人：Leo, PongPong SHOWNOTES 01:36 国内外AI发展、政策和策略方面的不同点 10:51 揭示AI创业的奥秘。探索连接世界各地AI创业公司的共同点，以及不同地区所面临的独特挑战。 13:34 深入思考大型AI模型的世界。如何积极参与到这一趋势中，塑造未来。深入了解大型AI模型的影响，以及它们如何塑造行业和社会。 17:23 探讨大型AI模型在日常生活和工作中的实际应用。 28:44 关于在B端和C端中应用AI模型的热烈讨论。探索AI在不同行业中的多样应用，并深入了解这些模型如何改变行业，革新用户体验，推动创新。 30:26 展望未来，AI领域的令人激动的前景。背景音乐： Sunday Vibes Song by Masego and Medasin

34分钟