AI Odyssey - 节目列表

对话Lepton AI产品负责人:探索AI基础设施的设计与技术哲学

对话Lepton AI产品负责人:探索AI基础设施的设计与技术哲学

AI Odyssey

【主播的话】 大家好,新年快乐! 农历新年的第一期节目,我们有幸邀请到 Lepton AI 的产品负责人鱼哲。他将与我们深入探讨 AI 基础设施领域的最新动态和未来趋势。嘉宾不仅是一位从开发者转型为产品经理的 AI 行业专家,还曾负责高性能 AI 计算架构平台的工作,对 AI 应用层开发者的需求有着深刻的理解。 在本期节目中,我们将聚焦于 AI Infra 的核心挑战,探讨如何通过产品和技术的融合提升 AI 应用的性能和效率。嘉宾还将分享他对多模态模型、结构化输出以及 AI 应用开发者需求的独到见解。 本期节目为我们探索 AI Infra 的重要一步,我们将继续带来更多深入的解析和讨论。 嘉宾和主播长期在北美工作生活,夹杂英文在所难免,不接受抱怨!Enjoy! 【本期嘉宾】 Yuze 鱼哲,毕业于美国伦斯勒理工大学。前阿里云高性能AI平台产品负责人。专注于AI在金融量化,风控,搜索推荐,自动驾驶,互联网娱乐等行业落地及应用。目前在北美明星AI架构平台Lepton AI 就任产品负责人。推特 @YuzeMa5。 【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 【本期焦点】 01:56 AI Infra 的目标用户和需求分析 03:45 AI 应用开发者的特点和需求 06:21 AI 应用开发的路径和挑战 08:25 AI Infra 的覆盖面和优化方向 10:10 具体案例讨论:动画片分镜制作的 AI 应用 13:44 AI 模型的可扩展性和后端服务的挑战 15:28 AI 推理方向的技术探讨 18:53 AI 性能优化的具体方法和案例 22:51 AI 模型的定制化开发和技术选择 27:12 RAG 在 AI 应用中的挑战 32:30 AI 模型推理的优化方向和实践 38:01 AI 模型推理的算法和硬件优化 42:36 AI 应用开发的优化策略和业务取舍 47:20 Lepton AI 的收费模式和用户成本 51:04 AI 应用开发的未来趋势和发展方向

62分钟
2k+
2年前
AI职场解密:AI求职指南与行业探秘

AI职场解密:AI求职指南与行业探秘

AI Odyssey

【主播的话】 在这一期的AI Odyssey 节目中,我们深入探讨了AI行业的求职途径和职业发展策略。非常荣幸请到了AI 大模型资深顾问许志鹏。许老师在大模型招聘方向有着丰富的经验。本次对话不仅给我们提供了宝贵的行业见解,还揭示了AI领域的最新趋势和就业机会。感谢您的聆听,希望本期节目能帮助您在AI行业开启一段精彩的职业旅程。 【本期嘉宾】 许志鹏 Roc(WeChat:LK99ER),复旦化学本科。伯周咨询创新业务负责人。典型项目:千人专家回国任上市公司研究院长,某大厂一级BU技术VP,某头部底座公司AIGC产品负责人。之前曾是CGL高级顾问和Fork AI招聘负责人,有过半年运作4位P9级大厂人才担任Startup CTO。 【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 PongPong 连续创业者,Startup 产品负责人 【本期焦点】 00:31- 许老师的自我介绍,随后讨论AI行业的历史和GPT模型的发展 02:09- 多模态技术和GPT4的普及影响,以及许老师对大模型领域的看法和个人经历 03:15- 许老师谈论加入AI行业的时机,以及AI企业对人才的需求和行业领导者 04:25- 分析AI领域主要公司和其创始人的特点 07:24- 探讨大型公司在AI领域的角色,以及垂直模型公司的介绍 09:40- 讨论国内大模型市场的趋势和竞争 11:48- 对不同公司大模型实力的分析,以及大厂和初创公司在招聘方面的差异 14:39- 分析大厂和创业公司在资源分配和风险承担方面的差异,及其在AI研究和开发方面的策略 18:32- 人才在大厂和创业公司间的流动分析,以及Leo分享对加入初创公司的看法 22:26- AI人才在地域上的分布,以及AI行业中的企业洞察和岗位分布 28:57- 技术推动产品和市场的变化及其特征 29:51- 讨论通用人工智能(AGI)的发展及其对社会的影响 31:39- 探讨国内大模型发展的困难,包括监管红线和算力资源的限制 33:02- 讨论国内外大模型行业的竞争和合作,以及对AI的重视程度 37:02- 分享AI行业的机遇,包括跨职位、职级和行业的交流机会 41:03- 对想进入AI行业的人的建议,包括评估公司的硬实力和软实力 43:32 - 讨论企业文化和年轻人生活态度在选择公司时的重要性 45:35- 讨论在大公司和创业公司工作的不同考虑因素 49:21- 探讨在技术驱动公司中理解产品和市场的重要性 53:24- 讨论AI行业未来趋势,包括潜在新玩家和现有玩家的角色

75分钟
1k+
2年前
GenAI快讯系列-第 4 期:本周精选 AI 资讯和 AI 产品一览

GenAI快讯系列-第 4 期:本周精选 AI 资讯和 AI 产品一览

AI Odyssey

欢迎来到《AI Odyssey》播客,这里是2024 年第一期的AI科技快讯。我们将为您带来本周AI领域的最新动态,欢迎收听! 【主持人】 PongPong, 以下是本期内容: 1. GPT的最佳自定义指令 * 00:04: 探讨GPT输出质量提升的自定义提示词 提示词地址 * 00:49: GPT-4安全性问题和API漏洞的揭示 2. OpenAI新一轮融资 * 01:37: 讨论OpenAI的估值和行业影响 3. OpenAI与微软被《纽约时报》起诉 * 02:00: 分析AI侵权案件和其对AI法律与道德问题的影响 Jason Kint推特热评 4. 苹果公司相关资讯 * 03:01: 苹果与出版商谈判,采集新闻内容训练AI * 04:05: 乔纳森·伊夫与OpenAI首席执行官Sam合作,人工智能与设计的结合 5. Stream Diffusion:图像生成的革新 * 04:49: 东京工业大学、麻省理工学院的图像生成框架 文献地址 6. BloombergGPT的故事 * 05:32: LLM的快速进步和成本效益 7. 百度文心一言的发展 * 06:18: 用户量破 1 亿 8. 快手KwaiAgents * 06:46: KwaiAgents的开源进展 技术报告 9. HiDream.ai的视频生成技术 * 07:50: 打破视频生成时长限制,为创作者带来新机遇 10. 旷视科技的多模态大模型Vary * 08:19: 文档级OCR能力的提升 11. 机器人基础模型 * 9:00: 斯坦福扫地机器人 * 09:20: 机器人领域的基础模型研究和应用 文献地址 AI 产品: babystoryai 可以模拟家长声音,生成给小孩讲的故事; 官网 habit-hero 通过 WhatsApp,利用 AI 生成个性化成长和规划指导的Coach; 官网 whatonearth 搜索引擎;数据更新于 24h 前,perplexity平替; 官网 Jellypod,将每日订阅邮件内容,整理为每日播客; 官网 impakt;个人 AI 健身教练 官网 感谢您的收听~

11分钟
99+
2年前
AI Native基础设施风口:向量数据库技术开发、应用和展望

AI Native基础设施风口:向量数据库技术开发、应用和展望

AI Odyssey

新年快乐!欢迎收听AI Odyssey 2024年的首期播客🚀 这期节目,我们邀请到了 Epsilla 的CEO宋壬初,一起聊一聊向量数据库的技术发展和未来展望。在这一期节目中,我们将深入了解向量数据库在AI应用中的重要作用,探讨如何将这一技术更好地融入到实际的业务和产品开发中。无论您是AI领域的初学者还是资深开发者,这期节目都将为您提供丰富的洞见和启发。 嘉宾和主播长期在北美工作生活,夹杂英文在所难免,不接受抱怨!Enjoy! 【本期嘉宾】 宋壬初(Richard Song, Twitter: @richard_epsilla),研究生毕业于康奈尔大学,现任Epsilla公司联合创始人兼首席执行官。Epsilla是一家专注于AI数据架构、向量数据库、检索增强生成的公司,在2023年夏天入选YCombinator创业孵化营,并获得YC 50万美金天使投资。创立Epsilla之前,宋壬初曾经是图数据库创业公司TigerGraph的高级工程总监,主导了TigerGraph Cloud和TigerGraph Suite的研发。 【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师,GenAI LLM发烧友。 【本期焦点】 01:05:向量数据库的基本概念和与传统数据库的区别 03:00:向量数据库在AI应用开发中的具体意义和作用 04:58:大模型微调和向量数据库结合的优势 06:28:长文本处理在大模型中的应用和挑战 07:24:向量数据库的不同检索方法和技术 09:18:公共向量数据库的使用和推荐 10:54:向量嵌入技术及其在多模态搜索中的应用 14:10:跨模态检索和嵌入技术的未来发展 17:23:如何构建和应用RAG(Retrieval-Augmented Generation)模型 20:25:讨论数据加载、切片和嵌入等关键环节 23:29:探索向量数据库在生产环境中的应用和挑战 26:53:向量数据库的客户端应用和部署选项 29:13:用户友好界面和开发工具的重要性 31:04:分析向量数据库与云服务和API的集成 34:07:向量数据库的效率、精度和召回率 38:36:RAG模型的未来趋势和必要性 41:58:向量数据库的数据隐私和安全性问题 46:10:讨论向量数据库的发展瓶颈和未来方向

50分钟
99+
2年前
GenAI 快讯系列-第 3 期:AI副业机遇

GenAI 快讯系列-第 3 期:AI副业机遇

AI Odyssey

欢迎来到《AI Odyssey》播客,这里是 12 月第二期 的GenAI科技快讯。我们将为您带来最新AI领域的动态,欢迎收听! 【主持人】 PongPong, 以下是本期内容: 00:34 1. GPT-4变慵懒: 探讨OpenAI GPT-4模型近期的表现问题,包括用户发现的一些独特自救方式。 01:39 2. ChatGPT上榜Nature:ChatGPT作为首个非人类实体入选Nature年度十大人物,标志着人工智能领域的重大进步。 02:57 3. ChatGPT聊天存档功能:OpenAI推出新功能,允许用户保存聊天记录,提升工作效率,特别是在文本密集型行业。 04:19 4. Meta 3D头像技术:讨论Meta推出的高逼真3D头像合成技术,及其对数字交互方式的潜在影响。 05:16 5. Midjourney Alpha上线:Midjourney Alpha版上线,提供网页上直接创造图像的新能力,对图像创作者具有重大意义。 05:51 6. PowerInfer引擎:上海交大团队推出的PowerInfer引擎,一种高效的CPU/GPU混合推理引擎,对AI领域具有重要贡献。 07:21 7. 多模态大模型操控无人机:北航智能无人机团队提出的多模态大模型操控无人机新架构,展现AI与现实世界互动的新方式。 08:27 8. 国内AI大模型发展:分析国内AI大模型领域的竞争格局,特别关注字节跳动和百度的前景。 09:34 9. AI版“爱丽丝梦游仙境”:斯坦福大学与谷歌合作开发的技术,能根据图像或文本生成连贯3D场景。 10:34 10. AI主播技术:讨论美国公司Channel 1推出的AI主播技术,及其对新闻行业的影响。 11:48 11. OpenAI加速器计划:OpenAI发布新的加速器计划,旨在推动医疗、教育、文化等行业的AI初创企业发展。 13:31 12. 谷歌AI团队重组:谷歌AI团队重组,引入Meta高级副总裁Bill Jia,可能影响其AI技术未来发展。 13:30 13. 字节跳动争议:字节跳动在开发大模型时使用OpenAI技术引发争议,反映AI领域的竞争和数据使用规范问题。 14:05 14. Gemini模型使用百度技术:谷歌Gemini模型在中文对话中使用百度技术,突出AI模型训练的数据来源复杂性。 14:33 AI副业赚钱资讯: * 推荐GitHub上的AI副业赚钱资讯项目,帮助人们在AI时代找到适合的副业机会。 Github地址:https://github.com/bleedline/aimoneyhunter 15:24 推荐AI产品:介绍三款AI产品: * AI Tamago 虚拟宠物 https://github.com/ykhli/AI-tamago * AI驱动的简历审核服务 https://automix.ai/ * Mozilla的AI网站开发项目“Solo” https://soloist.ai/ 以上是本期节目的主要内容,感谢您的收听。

16分钟
99+
2年前
GenAI快讯系列-第 2 期:本周AI大事件一览

GenAI快讯系列-第 2 期:本周AI大事件一览

AI Odyssey

欢迎来到《AI Odyssey》播客,这里是12月第一周的AI科技快讯。我们将为您带来本周AI领域的最新动态,欢迎收听! 【主持人】 PongPong, 以下是本期内容: 1. 00:17 ChatGPT 庆祝其第一个生日,展示了 AI 技术在消费者中的受欢迎程度和创新产品的市场竞争力;咨询地址:https://www.data.ai/en/insights/market-data/chatgpt-first-year-downloads-revenue/ 2. 01:16 MobileDiffusion 提出了一种新的解决方案,实现了手机上令人难以置信的 0.2 秒图像生成速度,推动了行业向更快、更高效的方向发展; 3. 4. 02:38 Mamba 大模型架构的提出,代表了 AI 大模型领域的一个重大突破,特别是在语言建模方面的优越表现; 5. 03:45 阿里研究团队和字节团队分别提出的 Animate Anyone 和 MagicAnimate,展示了 AI 在视频生成领域的巨大潜力和创新应用。 6. 04:30 谷歌发布了其最大规模、最强大的 AI 大模型 Gemini,展示了在 AI 领域的重大进步。 7. 05:34 AMD 发布 Instinct MI300X GPU,直接挑战英伟达 H100,显示了 AI 芯片市场的新竞争格局。 8. 06:23 英伟达 CEO 黄仁勋的对话揭示了公司的创立故事和领导力经验,为技术创新和企业领导提供洞察。访谈中文文字稿:https://mp.weixin.qq.com/s/L1byV32QJoIvhnpgLtWwiw 9. 07:14 王慧文入股硅动科技,标志着他在商业界的重要回归,展现了对科技创新的持续关注。 10. 07:54 马斯克的 Grok 大模型开放测试,展示了 AI 大模型的个性化和进化趋势。 感谢您的收听~

9分钟
99+
2年前
GenAI快讯系列-第1期:OpenAI内斗大戏

GenAI快讯系列-第1期:OpenAI内斗大戏

AI Odyssey

欢迎来到《AI Odyssey》播客,这里是11月第四周的AI科技快讯。我们将为您带来本周AI领域的最新动态,欢迎收听! 【主持人】 PongPong, Leo 以下是本期内容: 00:25 科技新闻 * OpenAI内部政变 * ChatGPT的数据安全问题:一个有趣的实验揭示了ChatGPT潜在的数据安全问题。当研究人员连续要求ChatGPT重复输出特定词汇时,如“poem”四次,结果发现ChatGPT开始输出无关的个人信息,包括姓名、职位、电子邮箱和电话号码等敏感数据。 * 参考论文:arxiv.org * SDXL Turbo发布:据测试报告显示,SDXL Turbo在图像生成领域的效率达到了新的高度。用户仅需输入文本,SDXL Turbo便能在一秒内生成高质量图像,速度之快令人惊叹。这一速度不仅超过了Midjourney、DALL·E 3等知名模型,甚至也超越了Stability.ai自家的Stable Diffusion系列。 * 开源地址:https://github.com/Stability-AI/generative-models * 在线体验地址:https://clipdrop.co/stable-diffusion-turbo * 论文地址:https://stability.ai/s/adversarial_diffusion_distillation.pdfPhind V7版本发布 * PhindV7版本:这一版本在性能上取得了显著的突破。CodeLlama-34B V2在huggingface的代码大模型排行榜上荣获第一名,成为首个在性能上超越GPT-4的开源代码项目。 * 测试地址:www.phind.com * 开源地址:huggingface.co 01:43 商业新闻 * HeyGen AI:一个引起广泛关注的视频生成工具。自从去年推出以来,HeyGen迅速成长,仅七个月就实现了100万美元的年度经常性收入(ARR),并在今年11月更是飙升至1800万美元。 * Pika Labs:Pika的团队相当精简,目前仅有 4 位全职成员,已经累计完成 3 轮、共 5500 万美元融资,最新估值为 2.5 亿美元。 * ChitChop AI:字节大模型出海产品 02:26 好文分享 * Perplexity.ai的创新搜索引擎:这篇文章主要讨论了Perplexityai如如何利用大型语言模型(LLMs)改变传统搜索引擎的模式。文章地址:forbes 02:45 产品体验 * Vidnoz 是一款免费的在线视频创作工具,它利用了 AI 和智能自动化。它提供了文本转语音、背景去除、人声去除等功能。官网地址:www.vidnoz.com * Create:专为简化开发流程而设计,它能够自动构建简单的原型,大大加快了初期开发阶段的速度。官网:https://www.create.xyz/ * DubbingAI 可以实时切换声音性别、音色和语言的AI语音技术应用,具备声音克隆、口音消除等独特功能。官网:https://dubbingai.io/ 03:29 特别话题 OpenAI 为什么发生内斗? 此次OpenAI罢免Sam和Apple辞退Steve Jobs有什么不同?

9分钟
99+
2年前
GenAI硬核技术系列 - 第1期:多模态大模型的控制和挑战

GenAI硬核技术系列 - 第1期:多模态大模型的控制和挑战

AI Odyssey

【主播的话】 新的一期硬核技术访谈来了!我们特别邀请到了多模态大模型领域的前沿研究者,加州大学圣塔芭芭拉分校(UCSB)的PhD李嘉琛。嘉琛将与我们深入探讨多模态大模型的核心概念与应用前景,从原始的语言模型到多模态学习的进化过程。我们将一同揭开大模型如何综合处理文本、图像、视频等多种数据类型的神秘面纱,并探索其在上下文理解、任务执行和规划等方面的巨大潜力。此外,嘉琛还将分享大模型在自动化、数据分析、娱乐等多个领域的应用案例。加入我们,一起探索大模型的无限可能! 嘉宾和主播长期在北美工作生活,夹杂英文在所难免,不接受抱怨!Enjoy! 【本期嘉宾】 Jiachen Li (李嘉琛, 推特:@JiachenLi11) 加州大学圣塔芭芭拉分校 (UCSB)三年级PhD,主攻机器人控制,多模态学习,生成式人工智能。Jiachen带队参加了Amazon SimBot Challenge,获得了第二名以及10w美元的奖金。 【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 【本期焦点】 * 01:40 - 讨论多模态大模型的起源和基本概念 * 02:10 - 介绍大模型从单一模态到多模态的转变,解释多模态大模型在不同数据类型间的应用 * 04:25 - 讨论大模型在自动化和数据处理方面的应用 * 05:12 - 探讨多模态大模型如何提供更丰富的信息。 * 08:00 - 讨论大模型在信息接收和任务执行方面的效率 * 10:30 - 讨论大模型在自动生成prompt方面的能力 * 13:10 - 分析大模型在长期规划和任务分解方面的能力 * 16:10 - 讨论强化学习在多模态大模型中的应用 * 23:02 - 讨论大模型在处理长期上下文方面的挑战 * 28:53 - 嘉宾分享关于奖赏塑形(Reward Shaping)的个人经历。 * 31:44 - 探讨在控制多模态大模型方面的未来方向 * 34:30 - 讨论降低延迟(Latency)的方法和最新进展 * 39:36 - 探讨未来大模型可能的发展方向和挑战 【特别话题】 * 关于大模型的未来发展:如何使用合成数据(Synthetic Data)有效训练大模型 * 在视频生成等领域如何解决一致性问题 * 未来大模型可能如何整合所有领域数据以提供更全面的服务

41分钟
99+
2年前
GPTs 浪潮:AI agent在新时代中的角色与影响

GPTs 浪潮:AI agent在新时代中的角色与影响

AI Odyssey

【主播的话】 今天的特别节目中,我们非常荣幸地邀请到了知名孵化器的杰出团队成员彭书航。在这一集中,书航将与我们深入探讨AI产品开发的投资策略,分析数据壁垒的重要性,并探索GPT Store对相关领域的影响。 加入我们,一起洞察AI技术的未来趋势和商业潜力,深入了解这一引领科技前沿的话题。 【本期嘉宾】 彭书航,Duke研究生毕业,某知名孵化器杰出团队成员,欢迎对Agent商业化感兴趣的朋友加微信沟通,微信:cedric_11k 【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 PongPong 连续创业者,Web3 Startup 产品负责人 【本期焦点】 01:24 1. AI产品与投资视角:讨论AI初创公司的挑战,如高成本和商业模式的构建难题 04:27 1. AI技术的未来方向 :探讨AI技术,尤其是AI Native在未来的重要性和发展方向 07:02 1. AI技术的应用与挑战 :讨论AI在实际应用中遇到的问题,例如成本、技术壁垒和用户数据的处理 09:54 1. 数据的角色与挑战:深入探讨数据在AI发展中的重要性,尤其是在提高用户体验和准确度方面的作用 14:20 1. AI产品在生活、工作与娱乐中的应用 :探索AI如何影响和改变人们的生活、工作和娱乐方式,以及未来的发展趋势 23:02 1. AI技术的社会影响与商业模式:讨论AI如何改变社会结构、创造新的职业机会,并探讨商业模式的转变 31:42 1. Prompt Engineering与AI应用:分析prompt engineering在AI应用中的重要性、挑战和发展方向 42:03 1. 未来展望与总结 :对AI技术未来在创造性领域等的应用提出展望,并对本次讨论进行总结 【特别话题】 * AI Native的发展:深入讨论了 AI Native产品的概念,即完全由 AI 从头到尾驱动的产品和服务,以及这些产品可能对社会和行业的长远影响 * AI在现代社会中的角色:分析了AI作为个人和企业助手的潜力,包括如何通过AI优化日常生活和工作流程 * Prompt Engineering的重要性和挑战:探讨了在与AI交互中,如何有效地设计和使用 prompt 来提高AI的效果和精确度 * AI技术的未来发展方向:对AI技术的未来发展路径进行了展望,特别是在逻辑推理能力、自动化和推荐系统方面的潜在进步

50分钟
2k+
2年前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧