https://babi.com/

节目列表: 半球观察 - EarsOnMe - 精选播客,一听即合

Vol.03.【漫谈AGI】从OpenAI o1聊聊大模型的推理和中日美的大模型生态

半球观察

自2022年底以来,ChatGPT引领的生成式AI浪潮席卷而来,各式各样的大模型轮番登场,人们的生活似乎也正在被一个又一个与大模型的对话框占满。大模型相关的创业者和创业公司如雨后春笋般你方唱罢我登场,AGI似乎近在咫尺。 我们将开创一个全新的系列:【漫谈AGI】,在这个纷繁复杂而又飞速发展的时代,与您分享我们关于AGI和LLM在业界,学界和不同国界的进展,未来,和可能性。 本期为第二期,我们来与您聊一聊Open AI在五天前最新发布的推理大模型:o1,谈一谈o1背后的架构原理和可能的技术路线,以及聊一聊这2年来,在中国,美国和日本,大模型的创业生态和入局大模型的大公司分别都各自有着怎样的机会,和他们背后的故事。 本期《半球观察》,与您相约。 ----------------------------------------------- 《半球观察》终于有听友群啦!您可以通过微信搜索添加 philgroup 加入我们的微信听友群,或小红书搜索“半球观察”关注我们加入我们的小红书听友群,阿P和P特期待倾听您的意见,反馈与交流~ 欢迎您通过邮箱与我们交流节目中的观点,选题与您自己的看法。 E-Mail: banqiu@fastmail.com 您也可以在网易,喜马拉雅,Apple Podcast,Spotify和YouTube Music上同步收听与订阅。 ----------------------------------------------- 【本期您将会听到】 00:19 - o1诞生的背景,o1目前可以达到怎样的一种能力?o1可能采取的架构和训练方法的分析与猜测。 03:59 - 陶哲轩评价o1可以达到数学系medium graduate的水平。 09:27 - OpenAI新提出的inference time scaling law是什么?到底是噱头还是真的未来的技术路线?聊一聊硅谷之前的三条到达AGI的可能路线和各自遇到的问题。 17:51 - o1为什么隐藏掉了思维链的思考过程?背后的原因猜测与分析。在大模型业界,也许也会存在类似于传统软件与硬件之间的“安迪比尔定律”,即神经网络架构的发展与强化学习对模型能力的加强呈现相辅相成的关系。 25:23 - 国内的大模型公司会跟进这次OpenAI提出的技术路线吗?怎么跟进? 28:27 - 聊聊中国的大模型生态。DeepSeek,Moonshot,MiniMax,智谱,捏TA,以及一众大厂。中国的生态似乎更偏娱乐化。 39:20 - 聊聊美国的大模型生态。Cursor,Perplexity,Flux,OpenAI,Anthropic...美国的生态似乎在强调效率至上。 54:12 - 聊聊日本的大模型生态。几乎只有Sakana AI。Sakana AI的产品,理念,融资,和未来发展。

74分钟
99+
1年前

Vol.02.【漫谈AGI】深入聊聊AI Agent:有用还是有趣,这从来不是个选择题

半球观察

自2022年底以来,ChatGPT引领的生成式AI浪潮席卷而来,各式各样的大模型轮番登场,人们的生活似乎也正在被一个又一个与大模型的对话框占满。大模型相关的创业者和创业公司如雨后春笋般你方唱罢我登场,AGI似乎近在咫尺。 从本期开始,我们将开创一个全新的系列:【漫谈AGI】,在这个纷繁复杂而又飞速发展的时代,与您分享我们关于AGI和LLM在业界,学界和不同国界的进展,未来,和可能性。 本期为第一期,我们来一起与您聊聊AI Agent,这个被无数人视为最AI Native的LLM产品方案,又被无数人视为最没有想象力和注定将被下一个KillerApp推下王座的时代眼泪。 大模型的潮水逐渐落去后,AIGC的应用落地成为了新一轮竞赛的首要课题。AI Agent,这个复杂而又符合直觉的赛道,似乎成为了大模型落地最有前景的产品路线。 AI Agent究竟是什么?它背后的LLM的基础能力对他有着怎样的制约?它的落地场景是什么?它擅长什么又不擅长什么?AI Agent应该做的更泛娱乐化和有趣,还是应该效率为王,帮助人们去做有用而又机械的工作?关于LLM的未来,我们应该如何去想象? 本期《半球观察》,与您相约。 ----------------------------------------------- 《半球观察》终于有听友群啦!您可以通过微信搜索添加 philgroup 加入我们的微信听友群,或小红书搜索“半球观察”关注我们加入我们的小红书听友群,阿P和P特期待倾听您的意见,反馈与交流~ 欢迎您通过邮箱与我们交流节目中的观点,选题与您自己的看法。 E-Mail: banqiu@fastmail.com 我们的网站是: banqiu.xyz (建设中) 您也可以在网易,喜马拉雅,小宇宙,Apple Podcast,Spotify和YouTube Music上同步收听与订阅。 ----------------------------------------------- 精选片段 * 00:59 - Agent概念已存在多年,为什么想聊AI Agent?为什么AI Agent随着LLM又火了? * 02:52 - LLM的一些概念科普。什么是训练?什么是微调?什么是推理?什么是Token?什么是Prompt?什么是Serving? * 25:24 - 大模型的快慢思考能力是如何来的?从技术角度来看慢思考。 * 30:01 - AI Agent带来的个性化的廉价化,实际在针对人们一直以来的固有需求制造市场,它是一类全新的商品。LLM加持的AI Agent之所以会被大量用于提供情绪价值,是因为过去没有一种可以大规模生产化的廉价方式去为人们的普遍需求服务。 * 37:01 - 情感需求这些私人化的个性化很难量化(小红书做社区文化的一些例子)。AI Agent即使使私人个性化廉价化,但如何做好个性化依然是个不小的挑战。 * 44:48 - 效率型的个性化(如秘书)的廉价化,会降低交流和沟通成本。但很难最终代替人,它更像是人类能力的增强。 * 48:45 - LLM的Memory和长上下文,对Agent的影响几何?有没有使理解力变得更加廉价化?他的局限性在哪里?55:30 - 现阶段AI Agent的理解力主要局限在哪?如何让AI Agent获得类似人类的更深层次的理解力? * 1:03:23 - 对于AI Agent,用语音交流远比用文本要顺应人的直觉。为什么现有的语音技术在AI Agent应用没有那么广泛? * 1:07:57 - 语音处理技术为什么那么贵?(如语音克隆)为什么现在还很难普及? * 1:14:27 - 大模型的幻觉的产生,业界如何用技术去解决它?他会限制Agent的发展吗? * 1:17:29 - 从人类的角度看LLM的幻觉,以及业界的解决方案和未来的技术路线。(RAG,思维链,知识图谱) * 1:22:08 - 大模型是因为没有长期记忆和没有办法做复杂的思考而具有幻觉的吗?如果大模型真的具有了长期记忆和复杂思考后,他会出现更高级的具有创造性的能力吗? * 1:26:12 - Scaling Law会让LLM具有创造性和复杂思考的能力吗?Scaling Law更像填鸭式教育,创造性也许不会产生。 * 1:30:58 - Scaling Law可以解决长期记忆吗? * 1:33:14 - Scaling Law提升的是基座模型的能力,算力发展后,也许未来AGI会诞生于Agents之中。 时间线 00:59 - Agent概念已存在多年,为什么想聊AI Agent?为什么AI Agent随着LLM又火了? 02:52 - LLM的一些概念科普。什么是训练?什么是微调?什么是推理?什么是Token?什么是Prompt?什么是Serving? 03:15 - 什么是训练(Training)? 08:47 - 什么是微调(Finetuning)? 12:56 - 什么是推理(Inference,On Serving Phase)?此处有些不准确之处,推理是针对训练好的模型,然后对他进行输入,然后他按照既定训练给出输出,这之间发生的过程。该过程中只会激活(Active)少量的Parameters,因此一般认为具有稀疏性。 14:49 - 什么是Prompt?什么是Token? 19:30 - 为什么这波大模型会带来Agent的大爆发? 20:24 - 快慢思考。对于大模型和人类,什么是快思考,什么是慢思考? 25:24 - 大模型的快慢思考能力是如何来的?从技术角度来看慢思考。 27:19 - 有趣的Agent和有用的Agent。 30:01 - AI Agent带来的个性化的廉价化,实际在针对人们一直以来的固有需求制造市场,它是一类全新的商品。LLM加持的AI Agent之所以会被大量用于提供情绪价值,是因为过去没有一种可以大规模生产化的廉价方式去为人们的普遍需求服务。 37:01 - 情感需求这些私人化的个性化很难量化(小红书做社区文化的一些例子)。AI Agent即使使私人个性化廉价化,但如何做好个性化依然是个不小的挑战。 44:48 - 效率型的个性化(如秘书)的廉价化,会降低交流和沟通成本。但很难最终代替人,它更像是人类能力的增强。 48:45 - LLM的Memory和长上下文,对Agent的影响几何?有没有使理解力变得更加廉价化?他的局限性在哪里? 55:30 - 现阶段AI Agent的理解力主要局限在哪?如何让AI Agent获得类似人类的更深层次的理解力? 1:03:23 - 对于AI Agent,用语音交流远比用文本要顺应人的直觉。为什么现有的语音技术在AI Agent应用没有那么广泛? 1:07:57 - 语音处理技术为什么那么贵?(如语音克隆)为什么现在还很难普及? 1:11:55 - 语音技术距离出现真正好用,成本低廉的端到端处理模型,还有一段路要走 1:14:27 - 大模型的幻觉的产生,业界如何用技术去解决它?他会限制Agent的发展吗? 1:17:29 - 从人类的角度看LLM的幻觉,以及业界的解决方案和未来的技术路线。(RAG,思维链,知识图谱) 1:22:08 - 大模型是因为没有长期记忆和没有办法做复杂的思考而具有幻觉的吗?如果大模型真的具有了长期记忆和复杂思考后,他会出现更高级的具有创造性的能力吗? 1:26:12 - Scaling Law会让LLM具有创造性和复杂思考的能力吗?Scaling Law更像填鸭式教育,创造性也许不会产生。 1:30:58 - Scaling Law可以解决长期记忆吗? 1:33:14 - Scaling Law提升的是基座模型的能力,未来算力发展后,也许AGI会诞生于Agents之中。 1:37:20 - Scaling Law在未来依然还有很长路发展。未来也许为了训练模型具有结构化思维,会产生专门的新的文件格式。 1:40:54 - AI Agents综合了工程,认知心理,计算机科学,和哲学的思考,他会推动你思考人类思维的本质。

102分钟
99+
1年前

Vol.01. 从微软全球大宕机到萝卜快跑:科技在让世界更好吗?

半球观察

7月的我们,在月初经历了萝卜快跑与自动驾驶带来的科技震撼和对未来失业的焦虑,在月末也见识到了几乎波及到每个人日常生活的微软全球大宕机。科技似乎在让我们的生活变得更美好的同时,总会伴随着一些无法避免的问题。本期,P特和阿P一起,与大家从作为软件工程师出发的技术的角度聊一聊这两件科技新鲜事,也谈一谈作为一个普通人对AI代替人工的焦虑和担忧。 本期《半球观察》,与您相约。 ----------------------------------------------- 《半球观察》终于有听友群啦!您可以通过微信搜索添加 philgroup 加入我们的微信听友群,或小红书搜索“半球观察”关注我们加入我们的小红书听友群,阿P和P特期待倾听您的意见,反馈与交流~ 欢迎您通过邮箱与我们交流节目中的观点,选题与您自己的看法。 E-Mail: banqiu@fastmail.com 我们的网站是: banqiu.xyz (建设中) 您也可以在网易,喜马拉雅,小宇宙,Apple Podcast,Spotify和YouTube Music上同步收听与订阅。 ----------------------------------------------- 精选片段 * 05:15 - Windows大宕机的原因,其背后的技术细节与C++bug * 19:44 - 本次自动驾驶的技术细节,端到端模型与之前的模型有何不同?Rule-based vs Learn-based的路线区别是什么? * 37:00 - 日本的自动驾驶生态如何? * 40:30 - 日本的劳动力短缺现状,与货运市场自动驾驶生态。对比中美,日本的货运自动驾驶更具成本优势和利益空间。(列举出了2021年的数据) * 51:15 - 对于自动驾驶,需要有一个定量化的安全尺度,制订好以统计数据量化的法规,严格依法依规监管,除法律规定外允许自动驾驶出事故,对于行业发展至关重要 * 55:45 - 中美政策监管尺度的不同,是否会反向作用导致技术上产生差距? * 59:30 - 自动驾驶企业取得成功,是技术制胜还是政策因素更加具有决定性作用?会对经济产生足够的正向作用吗? * 01:06:40 - 自动驾驶可行性若在中国取得验证,会推动美国与其他国家放开 * 01:11:45 - 接下来两年,需要关注“萝卜快跑”们的哪方面?技术路线拼到最后,一定是在拼安全 * 01:14:23 - 自动驾驶会给美国司机带来失业焦虑吗? * 01:18:45 - 作为重资产行业,Robotaxi未来的形态是寡头垄断,还是会是个人持有分摊风险?大公司也许会自发去只卖产品和服务,收益和风险归个人。 时间线 00:32 - Windows大宕机,以及在全球造成的影响 05:15 - Windows大宕机的原因,其背后的技术细节与C++bug 11:10 - 自动驾驶的系统会不会发生宕机及其背后的安全 15:28 - Waymo,和萝卜快跑 19:44 - 本次自动驾驶的技术细节,端到端模型与之前的模型有何不同?Rule-based vs Learn-based的路线区别是什么? 28:36 - 为什么现在存活下来的自动驾驶初创所剩无几? 30:44 - L3和L4,自动驾驶和辅助驾驶的区别 31:50 - 激光雷达和摄像头方案的技术争议,与端到端模型的联系 37:00 - 日本的自动驾驶生态如何? 40:30 - 日本的劳动力短缺现状,与货运市场自动驾驶生态。对比中美,日本的货运自动驾驶更具成本优势和利益空间。(列举出了2021年的数据) 44:00 - 日本的自动驾驶市场,对海外的创业公司有吸引力吗? 46:15 - 中美日对自动驾驶的政策态度,政策对自动驾驶技术落地至关重要 49:05 - 从Cruise的事故看自动驾驶在市场与民众间的接受度 51:15 - 对于自动驾驶,需要有一个定量化的安全尺度,制订好以统计数据量化的法规,严格依法依规监管,除法律规定外允许自动驾驶出事故,对于行业发展至关重要 55:45 - 中美政策监管尺度的不同,是否会反向作用导致技术上产生差距? 59:30 - 自动驾驶企业取得成功,是技术制胜还是政策因素更加具有决定性作用?会对经济产生足够的正向作用吗? 01:06:40 - 自动驾驶可行性若在中国取得验证,会推动美国与其他国家放开 01:11:45 - 接下来两年,需要关注“萝卜快跑”们的哪方面?技术路线拼到最后,一定是在拼安全。 01:14:23 - 自动驾驶会给美国司机带来失业焦虑吗? 01:18:45 - 作为重资产行业,Robotaxi未来的形态是寡头垄断,还是会是个人持有分摊风险?大公司也许会自发去只卖产品和服务,收益和风险归个人。 01:32:35 - 产业革命会带来巨大变化,出行作为人的四大基本需求之一,它的革命会带来新的变化

94分钟
99+
1年前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧