活动预告🥳:4 月 26 日,我们会请到 sheet0.com 创始人文锋做一场线下活动,大家记得翻到 shownotes 末尾查看报名信息! 关于 Agent 这个话题,我自己有一些核心在思考的问题,相信这些也是很多人同样会有疑问的地方,这期播客中我们就这些问题展开了讨论,并基本得到了一些答案: 1)怎么定义 Agent,Agent 最重要的是什么 2)今天的 Agent 和两年前的 Agent 的区别是什么 3)如何简单快速理解 Function Call,Coding Agent,MCP,A2A,Computer Use,Browser Use 等概念 4)不同方式的区别是什么,有什么优劣之分吗 5)怎么看通用 Agent 和垂直 Agent 的区别,终局是什么 6)AI Coding 和 Agent 最终会是一件事吗,或者二者会有什么关联 7)Workflow 和 Agent 的区别和终局 8)RL 这件事在 Agent 里的重要程度是什么,一家公司(尤其是做 Agent 的创业公司)到底该如何使用 RL 9)大模型自身的 Agent 比如 OpenAI Operator 和其他应用产品的区别是什么,最终市场形态会怎样 10)如何快速判断一家 Agent 公司做得好不好 另外,在整段讨论中,本期嘉宾文锋基于长时间对 Agent 的研究和实操,还提出了很多理解和分析 Agent 的框架和关键要素,以及在接近结尾部分留下了让我非常有启发的一句话:AI Coding 是大模型的灵巧手。 【人类博物馆】 导游:曲凯,42章经创始人 33 号珍藏:王文锋,Agent builder,sheet0.com Founder & CEO,连续创业者,有近十年 AI、Data Infra 产品设计和 Coding 经验。sheet0.com 已开放 waiting list 申请,即将内测。 【时光机】 * 00:47 Agent 三要素:LLM、Context、Tool Use * 1:17 这波 Agent 和过去两年的区别是什么? * 2:30 怎么理解 Agent 中的 Context? * 4:21 快速理解 Tool Use 的不同方案 * 4:40 代码调用支线:Function Call、MCP、A2A 之间的区别是什么? * 6:35 模拟人类支线:浏览器是大模型能调用的最重要的工具 * 7:07 两条支线各有优缺点,也可以混合起来 * 10:27 Manus、Devin、Genspark 各用的什么方案? * 12:25 Browser Use 的核心价值是给用户提供「安全感」 * 14:19 AI Coding 和 Agent 最终会殊途同归吗? * 16:15 Agent 的终局会走向通用还是垂直? * 17:17 脱离了 RL,Agent 就不成立了 * 19:15 所以 Agent 创业公司该如何使用 RL? * 22:54 一个非共识理解:聊天框 + 场景推荐 UI 界面就是最好的交互形态 * 31:54 Sheet0 是一个怎样的 Agent 产品? * 34:15 怎么把任务执行的准确率做到了 100%? * 35:39 Workflow 会被 Agent 颠覆掉吗? * 36:49 不同 Agent 的核心区别是什么? * 39:05 AI Coding 是大模型的「灵巧手」 * 41:41 Agent 有两大「信任」命题 * 44:22 分享一个预测 Agent 未来发展的思考框架 * 47:33 如何快速判断一家 Agent 公司做得好不好? 【Reference】 文锋推荐大家都读一读强化学习之父 Richard Sutton 的《Reinforcement Learning:An Introduction》 【活动预告🥳】 4 月 26 日,我们会请到文锋做一场线下活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流! 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
当 AI 预训练的 scaling law 开始放缓,强化学习 (RL) 接过接力棒,拉出了一条漂亮的第二曲线。 在当下的 Agent 热里,有 RL 能力的团队,也是最被看好和押注的。 但很多人对 RL 都没有一个足够清晰的理解,包括我自己。 所以这期我们请到了国内 RL 领域的专家、清华大学交叉信息研究院助理教授吴翼,来讲讲 RL 的原理到底是啥、RL+LLM 的路径是怎么发展起来的、目前存在哪些非共识、未来还会怎么演变等等(聊完感觉像上了一堂免费大师课)。 而且聊着聊着,我们发现,人生就是一个 RL 的过程,区别是 RL 有明确的奖励函数,但是人生没有。可能如吴翼教授所说,我们首先都要以一种「最大熵」的方式去主动和不确定的世界交互,才能找到自己的奖励函数,优化自己的人生曲线。 最后,吴翼教授的团队最近开源了一个 RL 框架 AReaL-boba,在 SOTA 7B 上跑出了 AIME24 61.9 的分数,也欢迎大家去 GitHub 关注。 【人类博物馆】 导游:曲凯,42章经创始人 32 号珍藏:吴翼,清华大学交叉信息研究院助理教授,前 OpenAI 研究员。 【时光机】 * 1:51 到底什么是 RL? * 4:25 人生就是一个强化学习的过程 * 6:22 RL 和 LLM 是怎么结合起来的? * 7:01 强强联手第一步:InstructGPT,实现指令遵从 * 10:07 过程中衍生出了 RLHF * 11:41「慢思考」的需求催生了 RL 的应用 * 16:10 为什么说 Anthropic RL 做得特别好? * 21:17 行业对 RL+LLM 的最优路径形成共识了吗? * 25:11 RL 起来之后,对 Agent 的影响是什么? * 32:11 Intelligence = LLM (理解) × RL (决策),二者缺一不可 * 34:14 Scaling law 的未来 * 34:33 Pretraining 的两个发展方向 * 36:43 RL 还处于早期,进入深水区后可能会走向分化 * 40:02 大模型团队的组织架构要如何设计? * 43:21 一个反常识:对 AI 来说,理解比生成更难,token 消耗更大 * 47:38 现在做 Agent 一定需要一个懂 RL 的人吗? * 49:32 为什么 RL 人才这么稀缺? * 56:10 RL 目前三大分支:泛化 (DeepSeek)、代码 (Anthropic)、Agent (OpenAI) * 58:55 框架对 RL 意味着什么? * 1:02:51 RL 在海内外进展还有明显差距 * 1:04:42 想做好 RL,基建≫数据>算法 * 1:06:05 研究 RL 收获的一些人生启发 【Reference】 * 吴翼的 PhD 毕业论文:On Building Generalizable Learning Agents * 吴翼获机器学习顶级会议 NIPS2016 最佳论文奖的论文: Value Iteration Network * 吴翼提到的他非常喜欢的有关 Diversity-Driven RL 的两篇论文:Iteratively Learn Diverse Strategies with State Distance Information、Discovering Diverse Multi-Agent Strategic Behavior via Reward Randomization * 吴翼团队和蚂蚁研究院开源的强化学习训练框架:AReaL-boba 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
我又来美国了。 这次来,我发现市场真的变化太快,这边很多人都开始相信一个所谓「东升西落」的叙事。于是我再次请来了莫傑麟,和他聊聊二级市场自 DeepSeek 发布以来有哪些新变化、新趋势。 在这期播客里,我们推演了「东升西落」的演绎过程和底层逻辑,谈了我们各自对 DeepSeek 和 Manus 这两个热门产品的感受,也聊了宏观的市场环境和股市的未来。 最近两年很多人都在说,这波 AI 中的最赚钱的方式是炒股。 但真的是这样吗? 二级市场真的才是大家最终的归宿吗? 【人类博物馆】 导游:曲凯,42章经创始人 九号珍藏:莫傑麟,家族办公室资深从业者 【时光机】 Part1 「东升西落」的叙事 * 00:30 为什么二级市场突然流行「东升西落」的叙事? * 1:00 推演一下演绎过程和底层逻辑 * 5:19 之前大家过于低估国内 AI 了 * 6:47 中美对 AI 的叙事重点完全不同 * 7:27 简评 DeepSeek * 9:48 简评 Manus * 10:15 Manus 是最典型的中国式 AI 产品 * 11:58 Manus 爆火背后的两个核心原因 * 14:35 为什么后来风评急转直下? * 16:01 未来的 AI 产品可能要先在海外宣发,再杀回国内 Part2 二级市场的宏观环境 * 22:04 二级市场 = 预期 + 趋势 * 23:12 关于预期——大家对中国的预期是什么? * 24:39 为什么阿里加大对 AI 的 Capex 投入后,股价大涨? * 26:17 腾讯是 DeepSeek 这波的最大受益者 * 31:11 25 年的中国在重演 23-24 年的美国 * 33:48 芯片「卡脖子」还会是问题吗? * 35:42 关于趋势 * 35:52 暗线 (宏观环境):稳中向好 * 37:30 明线 (产业趋势):AI+专精特新+消费多点开花 Part3 股市的未来 * 38:44 今年 A 股会不会继续涨,美股会不会继续跌? * 41:13 二级市场在变得越来越卷,共识的达成和演绎速度越来越快 * 43:57 这波 AI 最赚钱的方式真的是炒股吗? * 46:44「大起大落的高频波动」可能是未来股市的常态 * 48:14「做时间的朋友」还行得通吗? * 49:54 分享一些 25 年的个人观察 * 50:18 AI 领域我会重点关注三个问题 * 52:53 很多非 AI 公司也很值得研究 * 54:56 二级市场是所有人的最终归宿吗? 【Reference】 为什么我们开始乐观?关于经济发展的明线暗线、AI 与最佳实践 | 对谈莫傑麟 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
如果有人问你,给你三个月的时间,你能把目前手上负责的业务数据翻十倍吗? 相信大多数人都会觉得这是痴人说梦,但这件事 ACE Studio 做到了。 而他们做到的原因不是他们本来就能,而是有人让他们相信了这件事。 这就是我们今天要讲的故事,这就是信念感这三个字的力量。 去年 5 月份我们做过一期 PMF 主题的节目,ACE Studio 的创始人 Joe 聊了很多他们的产品是如何在美国市场找到 PMF 的。当时他们刚刚开启付费半年,就已经做到了很不错的月收入。这次我们又把他请来,是因为才刚过去了大半年,他们的收入竟然就增长了 10 倍,已经成功跻身千万美金 ARR 第一梯队。 能做到这点,是因为他们去了硅谷一家很有名的孵化器 HF0,并在那边搞了 3 个月的封闭式开发。这期播客中,Joe 就毫无保留地分享了 HF0 到底是怎么奏效的、他们在 HF0 的实际体验与收获,和实现 10 倍增长的具体经验(比如他们是怎么一招就让公司一夜之间收入翻倍的?)。 如果你对 Joe 的参加孵化器的经验,或者对去美国参加类似的组织感兴趣,可以添加我的微信 qukai42,42章经今年也会组织更多中美连接的活动和事情,欢迎你用各种方式加入进来。 【人类博物馆】 导游:曲凯,42章经创始人 20 号珍藏:Joe,ACE Studio 创始人。ACE Studio 是一款面向专业音乐制作人和创作者的 AI 音乐工作站,致力于用 AI 重新定义音乐创作,自 2023 年 10 月上线以来发展迅猛,月收入已达 80 万美金。 【时光机】 Part1 HF0 为什么有效 * 01:23 先回顾下入选这家美国知名孵化器的过程 * 03:48 英语不好会是阻力吗? * 05:34 3000 进 10 的概率下,HF0 为什么选中了你们? * 07:19 HF0 和其它孵化器不太一样 * 08:46 HF0 没教我们怎么做业务,这事也不该别人来教 * 10:35 最关键的第一步:HF0 给我们注入了「一定能猛涨」的信念感 * 12:23 这种信念感很难自我激发 * 14:23 开营后,HF0 营造了一个专注于增长的氛围 * 16:25 最大的压力和最深的恐惧就是「别丢脸」… * 17:44 这种氛围本质上改变了我想问题的方式 * 19:17 也让我们涌起了「别让大家觉得华人不行」的责任感 * 21:38 一直 build「憋大招」可能并不成立 * 22:40 从 HF0 出来后,还能保持在其中的状态吗? * 23:55 我们马上要复刻 HF0 的体验 Part2 3 个月涨 10 倍的具体实践 * 26:50 五周过去都没怎么增长的时候,信念感崩塌了吗? * 27:43 绝境逢生的戏剧化转折:我们试了一招,第二天日收入直接 double * 28:51 Quora 创始人教会了我们一种思考方法 * 30:00 之前没想到这么干,是因为我们没悟到一件事 * 31:18 要问这招是啥?——答案乍一听可能有点搞笑哈 * 31:29 但搞笑背后是一种硅谷的方法论 * 32:57 在硅谷的几个经历也启发了我们 * 33:53 后面我们还试了很多招数,最终达成了 10 倍的增长 * 34:01 我们在价格模型上做了很多文章 * 34:24 Blake Anderson(千万美金 ARR 产品 Cal AI 的创始人)让我意识到,我们之前联系 influencer 的方式都不对 * 36:33 我们把付费广告的 ROI 提高到了 2 倍 * 36:59 产品功能升级和老用户也没落下 * 37:30 但前六周的苦工是省不掉的 Part3 一些观察 * 39:02 美国投资人的工作方式和提的问题有什么不同? * 40:31 美国机构真的很不喜欢中国团队吗? * 42:51 肉身到硅谷去很重要 * 43:12 我越来越坚信,AI 产品化大有可为 * 44:44 Perplexity 的 pitch deck 上有两句话,合起来看很妙 * 45:13 我的壁垒就是我的「人日」 * 46:47 硅谷的做事风格越来越回归本质了 【Reference】 * ACE Studio 产品界面 * 关于 HF0:HF0 是由 Dave Fontenot(世界上最大的黑客松 MHacks 创始人)、Evan Stites- Clayton 和 Emily Liu 共同创立的常驻创业孵化器,有着严苛的筛选标准,由包括 Marc Andreessen、Chris Dixon 在内的多位知名投资者支持,创办第一年就孵化出了 3 家独角兽公司,也孵化过包括 ComfyUI、Story.com 等在内的多家优秀的 AI 公司。 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
Binson literally 进了 ICU,一场严重的车祸让他对这个世界和创业这件事有了不同的认识。 这期播客中我们先聊了他的这场车祸,和他是如何度过在 ICU 的六个日夜的,相信这种经历是绝大多数人没有机会尝试甚至是听说的,而 Binson 恢复了四个月后已经可以比较正常地坐在我的对面回顾这段经历,他讲了在这个过程中他心态的一些变化,以及在事故之后他是如何改变他对待人生和经营公司的方式的。 Binson 在此之前是知名的大厂高管,他从百度副总监、360 助理总裁,一路做到了 bilibili 副总裁,所以我们也聊了他打工和换工作的很多经验,以及就是他为什么创业,现在又是如何看待 AI 和自己的心影随形(逗逗游戏伙伴)这个公司和产品的。 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【人类博物馆】 导游:曲凯,42章经创始人 31 号珍藏:Binson,心影随形 CEO。心影随形成立至今已获得多轮融资。逗逗游戏伙伴是其推出的一款陪用户玩游戏的 AI 桌宠软件,已有 600 万的用户规模。此前,Binson 曾先后担任百度副总监、360 助理总裁、bilibili 副总裁等职位。 【时光机】 Part1 车祸后的感悟 * 1:52 我是怎么差点挂了的? * 2:19 死里逃生的过程 * 7:56 更痛苦的是躺进 ICU 后的精神煎熬 * 12:01 我们活着的意义到底是啥? * 13:58 这件事教会了我「停下来」和「放手」的重要性 * 17:35 我创业的心态和行动有些具体的变化 Part2 大厂打工 V.S. 创业的体悟 * 22:38 如果真的只为了赚钱,不要创业 * 23:04 复盘三段大厂经历 * 23:20 我应该更早离开百度 * 25:09 为什么不应该为了两三倍工资而跳槽? * 27:15 为什么 20 年我选择去 B 站,而不是字节、快手、拼多多或者小红书? * 29:43 原本没想去 360,但周鸿祎给了我一个新的视角 * 35:12 作为一个如此有创业精神的人,为什么没有更早出来? * 37:33 创业首先要摒弃大厂思维 * 42:46 创业总是焦虑?多半是因为事先思考得不够充分 * 44:42 不要回避大厂竞争的问题 * 45:25 创业最难的是招人和统一大家的思路 * 46:22 成长最快的是工作两三年的 * 47:31「有爱」可以后天培养吗? * 47:57 一个残酷的现实是,大厂已经不育人了 * 49:13 分享一个有效训练决策能力的方法 Part3 聊聊 AI * 51:12 桌宠形态产品的留存高是一个值得炫耀的事么? * 52:06 为什么逗逗游戏伙伴很难被 copy? * 53:46 一些 AI 观察 * 54:10 今年会陆续有一批 AI 公司被淘汰 * 55:08 LLM 的进展超出预期,多模态则不及预期 * 55:53 Chatbot 这种模式可能就不对 * 56:17 我们不看对话轮数、不看留存、不看时长 * 58:49 一个值得思考的未来方向 【Reference】 * Binson 交通事故的完整经历和更多感悟,可以看他之前写的公众号mp.weixin.qq.com * 逗逗游戏伙伴桌宠形态的示意图: * 逗逗游戏伙伴陪玩《黑神话:悟空》的示意视频 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescalero
新年正式第一期,来点新东西。 大家都说 Agent 热,那 Agent 到底是啥、到底为啥热、到底咋做、到底长啥样? 大家都说 RL 是新方向,那 RL 到底是啥,和 LLM 的关系是什么,又能怎么和 Agent 结合? 这期我们就请到了在 Meta 工作了七年的应用强化学习组负责人朱哲清 Bill,讲一讲他是怎么用一种很新的技术路线来做一种很新的 Agent,并且在电商等领域是如何落地的。 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【人类博物馆】 导游:曲凯,42章经创始人 30 号珍藏:朱哲清 Bill,Pokee AI 创始人兼 CEO,此前 7 年在 Meta AI 做应用强化学习组负责人,并攻读了斯坦福大学强化学习专业博士学位 【时光机】 Part1 强化学习 * 3:06 我们思考方式已经全面 RL 化 —— from OpenAI 研究员 * 4:36 Transformer 和 RL 到底是什么关系?又要如何结合? * 10:15 RL 解答的是平行宇宙问题 * 12:35 RL+LLM,就是公认最好的技术路线吗? * 14:02 RL 的算法原理类似于「多巴胺刺激」 * 14:42 在无法清晰定义 Reward 的场景下,RL 还好用吗? * 15:12 RL 最强的三个能力 Part2 给 Agent 用上强化学习 * 18:42 为什么直接用 LLM 做不出规划型 Agent? * 20:17 一个有效的 Agent 架构:RL 做核心,LLM 做翻译 * 23:35 我们做出了一个电商领域的通用型 Agent * 24:39 体验相当于一个资深的网站负责人 * 26:05 原理是让 Agent 通过 self-play 学会使用上千个底层 API * 29:43 Agent 当前市场格局: * 29:52 Coding Agent 是皇冠上的明珠 * 30:26 Vertical Agent 遍地开花,但准确性仍是大难题 * 30:46 通用型 Agent 尚不存在,但 RL 或可迎战 * 31:17 万物皆可 call API * 34:07 一个具体的应用示例:Agent 是怎么帮商家省钱提效的? * 39:08 训练成本和推理成本都低得令人发指... * 40:33 先定一个小目标:做各行各业的 API 杀手 * 42:57 对 25 年硅谷 AI 市场的观察和预判 * 43:11 垂类 Agent 是绝对的热点赛道,融资并不困难 * 45:29 25 年是 Agent 真正落地的一年 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescalero
去年我们做了一期年终总结,叫《24、25 年会是下一代浪潮最关键的两年》,今天我仍然坚定的站在这个结论背后,24 年看似悲观实则蕴藏了很多机会,而 25 年就是爆发的一年。而还没有进场的人,可能 25 年就是最好的机会。 在这期播客中,我帮大家快速理解: 1)23 年 24 年市场发生了什么,核心重点是什么,原因是什么。 2)为什么市场普遍悲观,而我们却极其乐观。 3)当下市场中最流行的 Prosumer 概念是什么,为什么会有这个概念。 4)市场都说 Agent 是重点,我从传统软件到 SaaS 再从 SaaS 到 Agent 解释了这里的机会和做法到底是什么。 5)为什么多模态 2C 产品,反而是我们最看好的机会?这个可能就是 AI Native 的答案。 这期播客一共 30 分钟,23 到 25 年 AI 市场的精华都在其中。 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【时光机】 Part1 复盘过去两年的 AI 发展 * 00:50 市场从盲目乐观走向过度悲观(不过最近有新风向 * 02:26 24 年 1-9 月,一级市场是过去十年 (大概率也是未来十年) 之最差 * 04:19 模型侧符合我们 23 年初的 4 个判断 * 05:17 应用侧不及预期,但也有人赚到钱 * 06:35 为什么我们开始乐观? * 06:48 ① 9 月后,融资市场明显复苏 * 07:05 ② 多模态的能力在持续加强 * 09:04 ③ 大多数人忽略的一点是,AI 创始人的画像发生了明显变化 * 10:07 无论外部因素如何,最终起决定性作用的是资产价值本身 Part2 展望 2025 * 10:41 市场大环境会进一步变好,但会越来越两极分化 * 11:59 当下最好的选择不是创业,而是先加入一家 AI 公司积累经验 * 12:30 市场关键词演变:23 年「大模型」,24 年「具身智能」,25 年「应用落地 * 13:06 目前最具共识的是 Prosumer 赛道,可能会率先跑出千万美金 ARR * 15:03 此外我们最看好 Agent 和多模态 Part3 详谈 Agent 和多模态 * 15:30 Agent 会是 SaaS 的十倍? * 16:02 Agent 更可能是新公司的机会,而不是现有 SaaS 公司的机会 * 22:57 Perplexity 未来其实是一家 Agent 公司 * 26:25 AI Native 的答案是什么? * 30:28 早入场的人、乐观的人,往往都获得了回报 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
这期是我自己一直感兴趣的话题。 我一直觉得像德扑、狼人杀这样的游戏设置非常有意思,里面的各种理性策略、感性判断和说服人的能力,都能体现在现实世界的角角落落。相信绝大多数人都大抵接触过这些游戏,哪怕不是相关领域的专家,所以我们这次就请来了一位德扑世界冠军来一起讨论他视角下的德扑,以及其中很多“技巧”对这个世界的映射。 在整个聊天过程中,嘉宾说了无数次的“绝对理性”,也谈论了在游戏中是如何对“人”进行判断(比如行为基准线的概念),另外在结尾部分,他还说了一句点破社会经济运转规律的话,即“通胀是人生的大小盲”。 这期很多内容比较偏向于德扑本身,希望大家听完能够从中收获些对现实世界中博弈、决策和投资等的参照,也祝所有人都能跑赢通胀。 【人类博物馆】 导游:曲凯,42章经创始人 29 号珍藏:Ricky Mao,毕业于复旦、 MIT,前投资人、企业 CFO,现是全球 Global Poker Index 排名 200 左右、中国前 10 的扑克选手。曾获 WSOP(世界扑克系列赛,代表着竞技扑克的最高水平)金手链、两次 APT(亚洲扑克巡回赛)冠军。 【时光机】 Part 1 一个顶级牌手的核心素养 * 4:15 要素一:绝对理性 * 5:53 but how? * 8:34 那还能 all in 吗? * 10:26 要素二:识人 * 11:34 核心是知道基准线在哪里,然后分析每个人动作上的偏移 * 12:07 线下接触一个人,可以先通过外在形象给 ta 建模(日常生活不鼓励这么做哈 - 示例:金表大哥 v.s. 沙滩白男的行事风格模型 - 所以要怎么又快又准地给人建模? * 14:55 见不到面时,能通过什么信息来判断对方是什么样的人? * 15:28 国人更喜欢刺激、赌性更强 * 19:47 大家最常犯的错误是什么? * 21:16 行业 top,最后真正拼的是什么? * 22:29 要素三:掌握概率 Part 2 心态篇 * 23:41 为什么说「一场比赛毁一个冠军」? * 26:51 是人都会经历大的下风期 * 27:53 拿到金手链的精彩故事 * 28:20 我曾经想过:如果拿到金手链,我愿意第二天去死 * 29:04 肾上腺素飙升…反败为胜前的尖峰十小时 Part 3 策略篇 * 31:03 大部分人对 Bluff 的认知都不对 * 35:26 更激进的打法,能引向更好的结果吗? * 36:00 怎么打满价值? * 40:02 位置这件事,到底有多重要? Part 4 人生思考 * 41:01 绝对理性和保持感性并不矛盾 * 42:28 「再坚持一下」可能是一种有毒的心态 * 43:36 通胀是人生的大小盲,环境不好的时候你完全可以空仓 * 48:03 顶尖高手的风格都是万法归宗 【Notes】 * Tom Dwan:一位著名的德州扑克选手,以其非常激进和高风险的打法著称。节目中还提到了几位顶尖高手,包括 Eric Seidel、Phil Ivey、Daniel Negreanu、Dan Cates (Jungleman)、Adrian Mateos、Steven Chidwick。 * GTO(博弈论最优):GTO 策略是一种防守性策略,目的是让你不容易被对手剥削。在 GTO 策略下,玩家通过混合不同的行动(例如:下注、加注、弃牌等)来保持平衡,使得对手即使知道你的策略,也无法从中找到漏洞。 * 大小盲:德扑中使用的强制性下注结构中的两种盲注。小盲注(Small Blind)是由庄家左手边的玩家支付的强制性下注金额,通常为最小的注额。大盲注(Big Blind):是由小盲注左边的玩家支付的强制性下注金额,通常是小盲注的两倍。这些盲注的设置目的在于推动游戏进行,确保每一局牌都有一定的筹码池。游戏中的其他玩家可以选择跟注、加注或者弃牌,而支付盲注的玩家则已经支付了入池的初始金额。 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
活动预告🥳:12 月 7 日,我们会请到 Ted 做一场线上活动,大家记得翻到 shownotes 末尾查看报名信息! 在我 9 月份的硅谷行程里,我见过的印象最深、让我最有收获的人之一就是 Ted。 那个时候他正要离开 Character.ai,作为第四十多号加入的员工,他对于 C.AI 的产品、模型、训练等等的熟悉程度都非常高,这次很开心能把他请来,跟大家一起分享下美国最著名的 AI 公司内部是如何运作的,Post Training 的最佳实践是怎么做的,以及硅谷一众 AI 从业者的现状和认知等。 这期播客的内容基本代表了美国最一线的 AI 从业者的实践和认知,非常有代表性,希望对大家有帮助! 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【人类博物馆】 导游:曲凯,42章经创始人 28 号珍藏:Ted,前 C.AI 模型应用算法专家 Part 1 从内部视角看 C.AI * 01:06 为什么商业化一直没做起来? * 04:40 如果 C.AI 当时往 AGI 赌把大的,或者把产品交给字节系,能改写自己的结局吗? * 06:51 我们很认可 Talkie,但不想学 Talkie * 09:36 被收购后,你还相信 C.AI 类产品的未来吗? * 11:35 有人说「C.AI 不是真正的 AI 陪伴」,那它到底是啥? * 12:19 C.AI 为什么做得比别人好? Part 2 我在 C.AI 做 Post Training 的这一年 * 14:56 工作状态是 996(主动的哈,passion! * 17:15 Post Training 的核心是设计高效的迭代路径 * 18:42 四种迭代路径,都有很多低垂的果实可以摘 * 21:40 怎么评估和改善「模型变蠢」的问题? * 22:54 迭代中一个有趣的 EQ 涌现 * 24:19 Post Training 到底是怎么个流程? * 25:37 介绍 Post Training 三大件:SFT(监督微调) 、RLHF(人类反馈强化学习)、DPO (直接偏好对齐) * 32:07 以上天花板极高,RAG 和 Prompt Engineering 我们几乎没做 * 32:53 帮你拉开和同行差距的 2 道数据思考题: * 33:18 你微调用的数据,质量真的不能更高了吗? * 36:00 收集来的用户偏好数据,只能是点赞点踩吗? * 39:32 大家现在关注的几个技术难题,C.AI 是怎么做的? * 39:49 怎么做好评估? * 41:10 怎么做好意图识别? * 43:22 C.AI 的语音延迟基本是业界做得最好的,是怎么做到的? Part 3 硅谷观察 * 46:17 一个不被公开的秘密:ChatGPT 内部也是多模型混用? * 47:28 硅谷整体还是很乐观,推理侧仍然大有可为 * 50:45 硅谷现状: * 51:01 做产品的想靠多模态赚钱 * 51:06 搞算法的想复制 o1 * 51:16 两边都在期待自动交互 Agent 解锁的想象空间 * 53:48 复盘最近的硅谷求职记 * 53:54 Post-train 人才极其抢手 * 54:27 印象最深的是,面 Cursor 的时候,我甚至被允许用 Cursor 现场解题 * 56:03 最喜欢被问到「你觉得我们的 idea 有多不靠谱?」 * 56:45 如果我是面试官,我会考察面试者的这项直觉能力 * 57:28 我很喜欢现在硅谷的氛围!当下可能是华人扬眉吐气的最好时机 【活动预告🥳】 12 月 7 日,我们会请到 Ted 做一场线上活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流! 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
几周前,EVE 的产品宣传片一上线就在 B 站获得了超百万播放,且刷屏了朋友圈。 几天前正好和一个投资人聊天,大家在讨论未来的 AI 巨头和入口型的公司/产品到底有什么可能性,我当时就说 AI 陪伴类产品肯定是有大机会的,过去两年里,真正验证了 PMF 的赛道就是 Character.ai 类的产品形态,不管从用户量级还是时长等数据来看,这类产品都一骑绝尘。 当然,如 EVE 的创始人所说,在他眼中,C.AI 根本就还不算真的陪伴,这可能也是类似产品没有获得更大突破和成功的原因。作为最早的恋爱游戏类公司创始人,他有自己一套清晰的关于陪伴的定义,这不仅让他做出了最成功的乙男向游戏《奇点时代》,也让他能做出现在的这款万众期待的 EVE。 在这期播客中,我们具体聊了他是如何定义陪伴的、他是如何用各种复杂工程手段解决长期记忆等模型问题的、以及他是如何把游戏和 AI 产品结合起来的等等话题,作为最早期的内测用户之一,我非常相信 EVE 能在明年成为一款现象级的产品。 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【人类博物馆】 导游:曲凯,42章经创始人 27 号珍藏:Tristan,EVE 创始人,《奇点时代》创始人 【时光机】 Part 1 背景介绍 * 00:54 为什么我说 C.AI 类产品根本不是陪伴 * 2:38 陪伴的第一性原理 Part 2 工程设计 * 4:22 所有人都解决不了的长期记忆问题,你们是怎么实现的? * 4:55 被动记忆与主动记忆的区别 * 6:24 情侣实验与 128 个记忆槽位 * 8:03 给 AI 女友设计脑回路:我们用十几个模型搭建了一套工程管线 * 10:08 举个例子,一个最复杂的话题处理流程是什么样子的? * 12:44 交代一下成本与商业模式 Part 3 游戏设计 * 14:07 一个迷思:为什么只有你们把 AI 产品做到了这个程度? * 15:42 从游戏转做 AI 陪伴的明显优势 * 17:07 那些产品中的游戏化设计 (及用意) * 23:51《奇点时代》一年 2 亿流水,其实远低于我们对男性恋爱游戏的市场预期 * 25:00 我相信世界 50% 人都会需要一个 AI 伴侣 * 27:14 聊聊角色设计 Part 4 AI 设计 * 29:27 怎么做到 10 个月的时间就快速搞懂、搭建起这样一套 AI 架构? * 31:13 如何训练出市面上最好的情感聊天效果? * 32:39 我们找了一个天资卓绝的真人陪聊,试图复刻她的大脑 * 37:51 AI 陪伴的四个核心要素 38:10 超级对齐 38:26 真实时空感知 39:17 独立人格 43:20 荷尔蒙钩子 * 43:45 模型的情商和智商到底是怎样一个关系? 【Reference】 * EVE 预告 PV (内含产品内测申请链接) * EVE 模型系统工作机制: 【The gang that made this happen】 * 制作人:Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
活动预告🥳:11 月 7 日晚,我们会请到张海龙做一场免费的线上活动,大家记得翻到 shownotes 末尾查看报名信息! 前一阵 Cursor 刷屏,也带火了有关 AI Coding 的讨论。 AI Coding 到底发展如何了,Cursor 为什么火了,他们和 Github Copilot 的区别是什么,Coding Copilot 又和 Agent 的区别是什么?其他那些 AI Coding 公司都在做什么,为什么国内的 AI Coding 似乎不温不火?带着类似的种种问题,作为一个非技术背景的人,我找来了张海龙一起来聊聊 AI Coding 这件事。 海龙无疑是国内在 Coding 领域最有发言权的人之一,他写了 20 多年程序,一直致力于做给程序员的工具,他曾经是开源中国的联合创办人和 Coding.net 的创始人,最近的一年多时间里他也又重新创业在做 AI Coding 方向。在摸索了一段时间以后,他也经历过产品转型、也踩过坑,这些都让他对 AI Coding 有了更深的理解,也对当下这个市场各个公司和类别有了更好的判断。 所以,你可以把这期播客当做一个对 AI Coding 领域的入门和了解的素材,哪怕不懂编程,听完这期你也会有更深的了解和认知。 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【人类博物馆】 导游:曲凯,42章经创始人 26 号珍藏:张海龙,Gru.ai 创始人,前 Coding.net 创始人兼 CEO、开源中国联合创办人 【时光机】 Part 1 为什么国内的 (AI) coding 没做起来 * 1:56 Developers 是最不愿意花钱的一群人? * 3:37 我最新的感知是,海外比国内更卷 * 4:33 国内 AI coding 发展现状 * 5:31 国内是在有 PMF 之后卷,海外是在有 PMF 之前卷 Part 2 Coding Copilot vs Agent * 6:20 Copilot 与 Agent 的区别:Copilot 是给你一把电钻,Agent 是给你一个小弟 * 7:43 Copilot 已经明确跑通了 PMF * 7:52 简评赛道老大哥 Github Copilot * 9:03 详评新晋顶流 Cursor:成功靠的是大胆创新,大胆到一开始很多人觉得不靠谱 * 16:53 Agent 还没有找到 PMF * 17:27 Devin 等等都是有声量,无留存 * 18:53 但为什么这个赛道还如此拥挤? Part 3 关于 Coding Agent 的实践思考 * 21:30 我们找到的一个好落地的场景:Unit Test * 24:37 Agent 会最终淘汰 Copilot 吗? * 25:30 我不相信「编程大众化」的未来 * 27:44 模型会最终吃掉 Coding Agent 吗? * 30:50 我坚定地认为,AI 替代不了人类程序员 * 32:44 一些硅谷观察 * 32:52 有千奇百怪的 AI+ 项目,且能拿钱 * 33:52 我在国内啥 SaaS 都不买,来了这啥 SaaS 都买 * 35:27 最后的建议:多读论文多动手,获得那些微妙的体感至关重要 【活动预告🥳】 11 月 7 日晚,我们会请到张海龙做一场线上活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流! 【Reference】 * Cursor 成功的背后:两个 PMF 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
我们做过非常多创业者的访谈,这次不一样。 封诚作为一个连续创业者,在 AI 最鼎盛的时期,反而选择加入了大厂高途,并在内部负责 AI 产品的探索。之前也有人提过说想听到更落地的实际的 AI 在传统行业的应用,这期播客中我们就聊了他们是如何在业务中具体应用 AI 的,比如在获客、转化和交付等全链条场景中的探索和试错。 作为结果,目前他们已经能用 AI 把转化效率提升至少一倍,并且模式也已经完全跑通,相信这件事不只是在教育行业可以得到应用,在其他很多行业也是类似的。此外,我们自然也聊到了很多教育领域的情况,以及他在大厂做 AI 的感受。 最后提一个问题,你觉得 AI 到底能不能取代老师呢?而当 AI 可以帮老师解决几乎所有的问题时,老师实际存在的意义又是什么呢?我很喜欢这期播客中我们一起给出的答案。 最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看) 【人类博物馆】 导游:曲凯,42章经创始人 25 号珍藏:封诚,高途 AI 提效 & 创新产品负责人 【时光机】 Part 1 AI 赋能传统业务的核心是提效 * 01:56 体现在三个环节: * 02:47 交付端:提效不明显,但存在彻底掀桌子的可能 * 03:45 获客端:有很多短期的机会,但不可持续... * 06:38 转化端:价值最大,可稳定提效至少一倍 * 09:43 AI 把我们的成单率提高了 3-4 倍 * 12:42 招人之「让懂 AI 的人学业务」会好过「让懂业务的人学 AI」 * 14:23 转化场景里 AI 具体能做什么? * 16:25 提效的本质是给金牌销售配了一堆助理 Part 2 AI native 的探索和思考 * 17:11 用好 AI 的最大难题:大家 ego 太大,耻于摘那些低垂的果实 * 18:37 怎么培养创业者视角?稻盛和夫培养管理者的方式对我很有启发 * 22:10 AI 和教育的本质非常 match * 22:46 AI 提效这个事儿能不能外包来搞? * 26:31 AI+教育都有哪些全新的产品机会? * 29:35 当 AI 可以帮老师解决所有问题时,老师存在的意义是什么? * 32:45 创业者都可以问自己这三个问题 【活动预告】 10 月 24 日,我们会在北京办一场线下活动。除了主讲嘉宾封诚,我们还请到了其他嘉宾,在陆续确认中。感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识 & 交流!(尤其欢迎正在探索把 AI 和传统业务结合起来的朋友们~) 【The gang that made this happen】 * 制作人:陈皮、Celia * 剪辑:陈皮 * Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
与播客爱好者一起交流
播放列表还是空的
去找些喜欢的节目添加进来吧