硅基觉醒FM

Album
主播:
Harry_浩同学
出版方:
Harry_浩同学
订阅数:
2,014
集数:
8
最近更新:
3周前
播客简介...
hi,这里是硅基觉醒。 这是一档围绕AI前沿技术和商业变革的节目,汇聚了AI创业者、投资人、以及大厂一线的实践和观察。 我们希望一起见证超级智能的到来,迎接硅基觉醒的年代。欢迎大家在小宇宙平台和微信公众号关注我们!
硅基觉醒FM的创作者...
硅基觉醒FM的节目...

GPT-5发布了,为啥Coding成了最重要的事?

硅基觉醒FM

hi,这里是硅基觉醒。 这是一档围绕AI前沿技术与商业变革的节目,汇聚AI创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来,迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们! 这是我们关于GPT-5解读的第二期内容,上一期我们聊了GPT-5的产品发布,基础模型的格局演变以及人才竞争。而本期我们将聊聊Coding和AGI。作为本年度最受关注的模型发布会,为什么GPT-5大量的时间都在展示代码生成能力?这里面蕴含了OpenAI怎样的战略意图?GPT-5是否会威胁到anthropic目前在代码领域树立的心智?Cursor等AI编程公司与大模型企业未来将如何竞争,它们的护城河在哪里?为什么GPT-5号称达到了博士水平的智能,但是AGI仍然没有来?AGI还缺少的关键拼图会是什么?本期我们将围绕这些话题展开聊聊。作为Claude Code深度用户的史博士将分享基于一手实践经验得出的对Coding领域的判断。 【主持人】 Harry,7年一级市场投资经验,AGI信徒。 【本期嘉宾】 史业民,北大博士,前智源研究院研究员,研究方向为实时多模态模型、Multi-agent框架。 小苏,互联网大厂工作多年,丰富的投融资、出海以及产品运营经验,目前在做AI Agent产品的内部孵化。 【本期内容】 00:01:57 GPT-5发布会为什么主角是Coding? 00:05:14 AI领域的Killer APP就是Coding 00:06:26 AI编程赛道的竞争格局将如何变化? 00:12:22 大厂程序员的工作真的能被替代吗? 00:19:12 前端工程师可能受到的冲击更大 00:21:40 openAI会威胁到Anthropic在coding领域的统治力吗? 00:24:42 Cursor一定是希望openAI能在coding领域崛起的 00:26:34 为什么GPT-5达到了博士水平,但AGI还没来? 00:31:52 当前的AI还缺少感知和做原创性创新的能力 00:36:53 目前AI还无法从线下获取数据,以及具备人一样的长期记忆 欢迎订阅「硅基觉醒」播客 🚦我们希望一起见证超级智能的到来,迎接硅基觉醒的年代。汇聚AI创业者、投资人、以及大厂一线的实践和观察,在最前沿直击AI的技术与商业演变。 欢迎加入「硅基觉醒」部落,成为首批村民 🔮 与资深AI学者、创业者、投资人深入交流 🤖 寻觅你的技术与商业化伙伴,共商AI创业大计 📩 添加小助理微信【silicon_era】获取入群通道,或者扫描下方二维码,备注【硅基觉醒入群】

43分钟
99+
3周前

解读GPT-5发布:聊聊OpenAI的产品、战略与模型竞争

硅基觉醒FM

hi,这里是硅基觉醒。 这是一档围绕AI前沿技术与商业变革的节目,汇聚AI创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来,迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们! 近期,OpenAI终于发布了GPT-5模型,而这距离GPT-4的发布已经过去2年零5个月。GPT-5的发布可以说是今年大模型领域最值得关注的事件,因为它很大程度决定了本轮AI浪潮将如何继续演进。那么GPT-5是否能承接大家对于下一代模型的预期?基座模型的竞争格局将因此发生什么变化?为什么Coding成了本次发布会的主角?为什么说GPT-5不是技术新范式,但却是 OpenAI 的战略拐点?围绕这些内容,我们将展开聊聊。本次内容我们将分为上下两期发布,本期我们将先讨论GPT-5的产品发布,基础模型格局的演变以及人才竞争,而下期我们将围绕Coding和AGI展开聊聊。 【主持人】 Harry,7年一级市场投资经验,AGI信徒。 【本期嘉宾】 史业民,北大博士,前智源研究院研究员,研究方向为实时多模态模型、Multi-agent框架。 小苏,互联网大厂工作多年,丰富的投融资、出海以及产品运营经验,目前在做AI Agent产品的内部孵化。 【本期内容】 00:01:52 GPT-5的发布,是符合预期还是低于预期? 00:06:23 Open-AI是一家拥有海量用户的商业化公司 00:07:10 怎么看GPT-5加入Router机制? 00:10:51 真正的One Model可实现吗? 00:17:51 预训练的Scaling Law还能继续吗? 00:22:07 openAI还是最领先的模型公司吗? 00:25:00 受到AI冲击,谷歌的广告收入反而上升了 00:29:19 开源与闭源的竞争未来将如何变化? 00:37:07 openAI是否面临严重的人才流失? 00:44:15 Deepseek的战略选择 00:46:11 怎么看待Google最近发布的世界模型Genie3? 欢迎订阅「硅基觉醒」播客 🚦我们希望一起见证超级智能的到来,迎接硅基觉醒的年代。汇聚AI创业者、投资人、以及大厂一线的实践和观察,在最前沿直击AI的技术与商业演变。 欢迎加入「硅基觉醒」部落,成为首批村民 🔮 与资深AI学者、创业者、投资人深入交流 🤖 寻觅你的技术与商业化伙伴,共商AI创业大计 📩 添加小助理微信【silicon_era】获取入群通道,或者扫描下方二维码,备注【硅基觉醒入群】

51分钟
99+
4周前

15个问题,搞懂具身大模型的现状及未来

硅基觉醒FM

hi,这里是硅基觉醒。 这是一档围绕AI前沿技术与商业变革的节目,汇聚AI创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来,迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们! 2023年下半年具身智能开始获得关注,创业团队开始涌动,2024年国内涌现了超50个具身智能公司,获得了百亿元的资金投入。毫无疑问,具身智能是除了语言大模型以外最吸金的创业赛道。然而,由于具身智能的发展仍处早期,这也是充斥着泡沫的一个赛道。去伪存真,关注本质,本轮机器人及具身智能赛道的火爆,技术侧到底有何进步?2025年了,具身智能的大模型走到哪一步了?玄而又玄的世界模型究竟是什么?本期我们将用15个问题,厘清具身大模型以及世界模型的发展现状。 【主持人】 Harry,7年一级市场投资经验,AGI信徒。 【本期嘉宾】 Patrick,丰富的具身大模型、多模态大模型研究经验。曾获得AI顶会杰出论文奖。 徐超逸,具身领域研究员,曾就职于智源研究院、银河通用机器人,研究方向为移动抓取、三维视觉、遥控操作等。目前加入智在无界,师从卢宗青做相关研究。 史业民,北大博士,前智源研究院研究员,研究方向为实时多模态模型、Multi-agent框架。 小苏,互联网大厂工作多年,丰富的投融资、出海以及产品运营经验,目前在做AI Agent产品的内部孵化。 【本期内容】 🟢 Part 1 具身智能大模型 00:02:16 第1问:什么是具身大模型? 00:04:55 第2问:具身大模型发展处于什么阶段? 00:09:54 第3问:过去两年,具身智能研究最重要的3篇成果是什么? 00:14:39 第4问:端到端的具身大模型是确定性趋势? 🟢 Part 2 VLA模型(Vision-Language-Action Model) 00:18:35 第5问:什么是VLA模型? 00:22:11 第6问:VLA模型是如何训练的?有什么技术差异 00:28:39 第7问:VLA模型解决泛化问题了吗?目前的泛化性如何? 00:33:00 第8问:具身智能的数据成本有多高?怎么解决数据难题? 00:39:18 第9问:具身智能如何解决硬件百花齐放的问题? 🟢 Part 3 世界模型 00:42:19 第10问:什么是世界模型? 00:44:13 第11问:为什么视频生成模型SORA不是世界模型? 00:46:25 第12问:世界模型如何应用于具身智能领域? 00:49:20 第13问:VLA模型与世界模型,未来是什么关系? 00:51:13 第14问:世界模型目前最大的瓶颈是什么? 00:54:24 第15问:具身智能下一个最值得期待的突破是什么? 【本期播客提到的公司或名词】 VLA模型,指的是 Vision Language-Action Model(视觉-语言-动作模型)。简单来说,它是一种将视觉感知、语言理解与动作生成紧密集成在一起的多模态人工智能模型。VLA模型的核心目标是让机器人或智能体能够直接根据视觉输入(如摄像头看到的场景)和语言指令(如“请把桌上的蓝色杯子递给我”)来理解任务、规划并输出具体的动作控制信号(如关节运动、抓取、移动等),从而在真实物理环境中完成任务。 RT-2模型,是全球首个将视觉语言模型(VLM)与机器人控制直接结合的VLA模型,通过将动作编码为语言Token,实现跨模态语义推理。2023年由谷歌Deepmind推出。 π0模型,是由Physical Intelligence公司开发的通用机器人控制模型,基于视觉-语言-动作(VLA)架构,它采用流匹配(Flow Matching)技术建模连续动作分布,生成高频率(50Hz)运动指令,适应叠衣物、装箱等灵巧操作需求。 Diffusion模型,扩散模型是一种通过逐步添加和去除噪声来生成数据的深度学习模型,其核心原理分为正向扩散(添加噪声)和逆向去噪(生成数据)两个过程。该模型在图像、文本生成领域表现突出。在具身智能领域,π0通过流匹配技术将diffusion模型引入到具身智能模型当中。 GraspNet模型,由卢策吾团队构建的通用物体抓取框架,实现了任意场景下刚体、可变形物体、透明物体等各种类型的未见物体的抓取。 GraspNet首次将PPH(picks per hour)指标超越人类水平。 UMI,Universal Manipulation Interface,由斯坦福大学提出的用于机器人操作的通用数据采集接口。它是一种数据收集和策略学习框架,允许将技能从人类演示直接转移到可部署的机器人上的策略。 欢迎订阅「硅基觉醒」播客 🚦我们希望一起见证超级智能的到来,迎接硅基觉醒的年代。汇聚AI创业者、投资人、以及大厂一线的实践和观察,在最前沿直击AI的技术与商业演变。 欢迎加入「硅基觉醒」部落,成为首批村民 🔮 与资深AI学者、创业者、投资人深入交流 🤖 寻觅你的技术与商业化伙伴,共商AI创业大计 📩 添加小助理微信【silicon_era】获取入群通道,或者扫描下方二维码,备注【硅基觉醒入群】

59分钟
1k+
3个月前

2025年了,To B的AI商业化走到了哪一步

硅基觉醒FM

hi,这里是硅基觉醒。 这是一档围绕AI前沿技术与商业变革的节目,汇聚AI创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来,迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们! 距离ChatGPT发布已经过去两年半,乐观派认为AGI已经箭在弦上,而悲观派认为AI即将迎来一轮泡沫破裂。因此站在当下,我们认为有必要审视一下AI的落地应用,来厘清到底AI的商业化走到了哪一步。过去,海外的企业服务尤其SaaS领域诞生了大量明星公司,给投资人创造了可观回报,而中国的to B软件领域则始终没有发展起来,无数投资人折戟在了企服赛道,那么这次AI浪潮是否会成为国内to B领域的转折点?2025年了,To B的AI应用到底发展如何?AI是否会颠覆SaaS领域,是否还能照抄SaaS行业的估值与发展逻辑? 【主持人】 Harry,7年一级市场投资经验,2年互联网战略经验,AGI信徒。 【本期嘉宾】 王丹,公众号后浪new主理人,AI应用投资人,专注to B领域研究。 史业民,北大博士,前智源研究院研究员,研究方向为实时多模态模型、Multi-agent框架。 小苏,互联网大厂工作多年,丰富的投融资、出海以及产品运营经验,目前在做AI Agent产品的内部孵化。 【本期内容】 🟢 Part 1 大数据起家的Palantir成为AI to B领域的股王 00:02:30 海外哪些to B领域AI公司取得成功? 00:03:33 Palantir股价增长了7倍 00:06:10 大数据起家的Palantir为何能吃到AI红利? 00:10:53 Palantir的独特优势是数据处理和业务场景理解 00:12:16 微软的Copilot为何没有取得成功? 🟢 Part 2 企业AI搜索玩家Glean估值快速增长 00:18:20 Glean的业务及商业模式 00:19:48 国内企业知识库的落地现状 00:20:20 Glean取得成功的原因 00:26:39 AI是传统企服玩家还是新兴企业的机遇? 🟢 Part 3 中国的企服行业是否迎来转机 00:29:58 AI会成为中国SaaS行业的转机吗? 00:31:08 过去中国SaaS不成功的原因 00:35:08 AI 1.0时代发展艰难的智能客服公司,当下如何了? 🟢 Part 4 被AI改变的SaaS行业 00:49:20 AI Agent是否会取代SaaS行业 00:51:00 AI沿用SaaS的订阅模式是否合理? 00:57:55 AI公司的ARR指标是虚假繁荣吗? 🟢 Part 5 中国的AI to B应用将在哪里爆发 01:05:16 哪些垂类应用会取得爆发? 01:05:50 Martech领域快速增长的原因 01:08:30 低代码的开发平台是好的AI落地场景吗? 01:18:21 AI法律助手是好的落地场景吗? 01:21:43 直接面向终端客户提供服务是好的AI商业模式吗? 01:29:47 大模型初创公司该怎么做to B,会陷入AI四小龙的困境吗? 【本期播客提到的公司或名词】 Glean,成立于2019年,总部位于美国加利福尼亚州,是一家提供企业AI搜索服务的公司。其愿景是让每个人都能在工作中轻松使用AI。2024年9月,成功完成超过2.6亿美元的E轮融资,其估值已达到46亿美元。 Moveworks,成立于2016年,专注于企业级AI助手开发。2025年3月,SaaS巨头ServiceNow宣布以28.5亿美元全资收购Moveworks。 Harvey,成立于2022年,是一家专注于为法律和专业服务领域开发特定领域 AI 的公司。2025年2月,Harvey 宣布完成D 轮 3 亿美元融资,估值超 30 亿美元。 Mercor,成立于2021年,是一家面向AI招聘的初创公司。2025年年2月,Mercor宣布完成1亿美元B轮融资,估值攀升至20亿美元。 Palantir,成立于2003年,主要基于大数据分析和人工智能技术服务美国的军事、政府和金融机构等客户,在国防和安全领域的应用尤为突出。受益于近年AI业务的爆发,目前市值超过2700亿美金。 AppLovin,成立于2012年,该公司的平台服务于手机游戏的获客、变现、以及发行业务。目前市值超过1000亿美金。 Martech,即营销技术,是指企业用于自动化、简化和优化营销工作的各种工具和技术。 欢迎订阅「硅基觉醒」播客 🚦我们希望一起见证超级智能的到来,迎接硅基觉醒的年代。汇聚AI创业者、投资人、以及大厂一线的实践和观察,在最前沿直击AI的技术与商业演变。 欢迎加入「硅基觉醒」部落,成为首批村民 🔮 与资深AI学者、创业者、投资人深入交流 🤖 寻觅你的技术与商业化伙伴,共商AI创业大计 📩 添加小助理微信【silicon_era】获取入群通道,或者扫描下方二维码,备注【硅基觉醒入群】

96分钟
3k+
3个月前
硅基觉醒FM的评价...

空空如也

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧