Album

十字路口Crossing

关注科技、互联网、AI 的播客

Koji、Ronghui Koji
12.08万 订阅 115 集 2周前
播客简介
AI 正在给各行各业带来改变,我们在「十字路口」关注变革与机会,寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱新变化、新的可能性。 「十字路口」是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。
节目
OpenAI 和 Anthropic 共同看好的 FDE:AI 时代的新岗位出现,旧分工松动|对谈 Rolling AI

OpenAI 和 Anthropic 共同看好的 FDE:AI 时代的新岗位出现,旧分工松动|对谈 Rolling AI

十字路口Crossing

🚥 上月,Anthropic 和 OpenAI 在同一天分别宣布了各自的十亿美元级的企业 AI 合资公司,并且都称自己在做的事情是 FDE(Forward-Deployed Engineer,前置部署工程师)——帮助 AI 进入企业,从“能用”走向“上岗”,从“展示能力”走向“交付结果”。 本周「十字路口」,我们聊 FDE 这个正在被重新定义的岗位与分工:它究竟是在把“售前/交付”换个名字,还是代表 ToB AI 时代新的组织结构与商业边界?当模型越来越强,最后一公里为什么依然最难?企业真正缺的,到底是更强的模型,还是能把 AI 带进流程、接入系统、治理知识、持续迭代并对结果负责的人? 我们的嘉宾是 Rolling AI 的两位合伙人阿甘和刘开,他们是中国在企业 AI 落地与“交付能力产品化”方面实践最深、也最具代表性的团队之一。 如果你在寻找下一波 AI 的机会,这期内容希望给你一个可行动的视角:旧分工在松动,新岗位在出现,而新的创业机会,也往往从这些缝隙里长出来。 🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版已发布于 @十字路口Crossing 公众号。 🟢 01:08 快问快答 * 年龄、毕业院校、MBTI 与星座、一句话介绍 Rolling AI、收入与利润、团队规模、创业前经历 🟢 02:19 FDE:AI 不是软件,是劳动力 OpenAI 和 Anthropic 同一天宣布成立十亿美元级企业 AI 合资公司,都说自己在做"FDE"——他们到底在描述一件什么事? * 传统软件是工具,需要人来操纵。但 AI 本身就是劳动力。 * FDE 做的,其实有点像 HRBP:把"数字员工"送进企业。 * 为什么从 BCG 出来做这件事?MBB 在服务中国民企时,遭遇了什么困难? * 传统咨询交付 200 页 PPT,今天他们交付的是智能体。 🟢 08:22 首个案例:一个人带 50 个机器人,服务 600 万用户 * 出生率下滑,乳品企业急着找第二曲线。他们需要的不是几个营养师,而是"无限个"营养师。 * 全国注册营养师 40 万,目标用户是 8,000 万——供需差距 200 倍。AI 是怎么填上这个缺口的? * "如果有人说我要减肥,你的第一句话应该是:你又不胖,你为什么要减肥。"——这是人类师傅教给 AI 的。而找到好师傅,才是 FDE 最难的事。 🟢 19:58 FDE 是什么角色? 带着一批"清北学生"去便利店上班的工头。 * FDE 要做好三件事才能撤场:业务融合、知识治理、系统对接。 * 一个好的 FDE 需要三种核心能力:能一眼看穿业务痛点本质、人机协作的原生感知、能用 AI 工具快速构建原型。 * 这样的人,能短期培养吗?——不能。 * "你刚毕业,我想不到任何一件你能做、AI 做不了的事情。" 🟢 25:09 SOP 代表落后——标准化的终结 * 他认为 SOP 代表着慢、代表着落后——这是暴论,还是有逻辑支撑的判断? * 从消费端的"千人千面"(抖音),到生产端的"千人千面"(每个门店自己的经营决策)。 * 总部从"管控型"变成"赋能型",意味着怎样的组织重构? * 以及,哪类管理层会最先被消失? 🟢 28:21 那些消失的企业,真正输在哪里? 兰开夏郡的纺织业接了电,但没被电拯救——因为他们只把电接到了原来蒸汽机的大轴上,整个生产方式还是蒸汽时代的。 * "AI 这次变革对社会的影响幅度,会超过互联网,像当年电力革命一样大量取代智力劳动。" * 每次大的生产力革命,都有 95% 的企业消失——而他们都接了电、上了网。那些消失的企业,真正输在哪里? * 技术在整个 AI 落地过程中,占比不超过 1/3。剩下的 2/3 是什么? 🟢 32:01 AI 落地失败率超 50%:三大死法 * 第一大死法:CEO 对 AI 有"超出现实的预期"——"上了 AI 企业就起飞"。 * 第二大死法:让 IT 团队来主导 AI 项目。"谁懂怎么对付客户、让他买保险?是业务团队,不是 IT。" * 第三大死法:激励机制没跟着变。AI 带来了新的生产力,但生产关系没变——结果会是什么? 🟢 43:29 应届生在 AI 时代能做什么? * Rolling AI 的高二实习生,他说"丝毫不觉得输过任何一个平庸的五年经验咨询师"——为什么? * 商业 sense 和 judgment,能培养吗?他说他个人还没找到路径——"有些东西是天生的"。 * FDE 时代,判断一个人值不值得用,真正在看的是哪三件事? 🟢 46:49 OpenAI 和 Anthropic 为什么都突然下场做 FDE * 一种是"数据饥渴",一种是"利润饥渴"——真相是? * 大模型进入行业,遭遇的最大瓶颈不是模型能力,而是行业数据和知识的短板。 * ToB 本质上不是软件能独立完成的事,而是一个服务业——"需要又懂 AI、又愿意扎进去的服务者,才能改变这个世界。" * 为什么 OpenAI 和 Anthropic 的合资公司全都是 PE 结构?收服务费根本收不到那部分 upside。 🟢 49:08 FDE 公司不应该被 VC"投",而应该被 VC"拥有" "我们一年陪跑收 600 万,但帮客户省了几千万、多赚了几千万——那差价去哪了?" * 每一家 PE/VC 的投后部门,核心能力之一将会是帮被投企业做 AI 转型。 * "我们在同一个行业,只服务一家,绝不服务另一家。" * 当 AI 能带来真实的业绩增长,单纯按日收咨询费这件事本身就不够了——未来的商业模式指向哪里?Service as Software,还是 Result as a Service? 欢迎订阅「十字路口」: 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 本期主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站

55分钟
10k+
2周前
2026 AI 游戏全景扫描:四层图景、三大误区、一个共识缺口|对谈 405 游局筱宁

2026 AI 游戏全景扫描:四层图景、三大误区、一个共识缺口|对谈 405 游局筱宁

十字路口Crossing

🚥 「AI+互动娱乐 / AI+游戏」正处在一个奇妙的阶段:碎片化的 Demo 层出不穷、技术进步快到让人恍惚——AI 生成小游戏、交互短内容、AI NPC、世界模型、实时多模态——但真正能在大众层面形成共识的爆款作品仍然稀缺。 本期「十字路口」和关注 AI 互动内容与游戏的播客「405游局」串台,邀请到主播 / 资深游戏从业者筱宁,一起做一次 2026 年 AI 游戏的“全景扫描”:我们把行业拆成“四层图景”,指出三种最常见的误区,并讨论那个最关键的共识缺口到底是什么——以及它为什么更可能从野生土壤里长出来,而不是从大厂里“立项做出来”。 如果你是 AI 创业者、投资人,或正在关注下一代内容平台、互动娱乐与 AI 游戏,这期节目希望能给你一个框架:哪些确定了?哪些还在幻觉里?下一阶段最值得跟踪的变量在哪里? 🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版已发布于 @十字路口Crossing 公众号。 🟢 00:11 Opening * 游戏行业对这波生成式 AI 的反应,比互联网公司慢了很多。 * 筱宁在头部大厂做 UGC 游戏制作人,但有一个体感让她决定离开。 * 赛道的两个坐标:「互动」和「好玩」。 * 游戏真正的竞争对手,不是另一款游戏,而是抖音。 🟢 02:48 行业的四层图景 1. AI 作为工具:服务于互动内容/游戏的创作流程(更偏“提效/基建”)⁠⁠ 2. AI 作为创作入口:以 AI 作为新的“生成入口/创作方式”,更关注结果而非流程⁠⁠ 3. AI 作为交互对象:典型是陪伴类、AI NPC 等(把 AI 当作你在内容里“对话/互动”的对象)⁠⁠ 4. AI 改变娱乐关系:改变“谁创作/谁消费”、以及社交关系/娱乐关系如何被构建(例如“多人 + 一个 agent”的场景,AI 从 NPC 变成“社交基建/氛围调节”)⁠ 🟢 05:45 眼前一亮的作品们 * 《星布谷地》的娜洛做了三件事:示范怎么聊天、救场、调节氛围。当这三件事都做到了,它已经不是 NPC,而是一个社交基建的角色。 * 任天堂的《朋友收集新生活》(Tomodachi Life):捏人、设定剧情、当造物主、当导演、再当观众——「创作即消费」这个体验,为什么他觉得特别有意思? 🟢 10:43 AI 版愤怒的小鸟,还没出现 * 愤怒的小鸟不是手游史上最赚钱的,但它是第一个让所有人形成共识的那个。 * 为什么用愤怒的小鸟来类比? * 那个关键时刻目前还没出现——不是因为技术不够好,而是还缺少一件具体的事情。 * 「AI 版愤怒的小鸟」更可能从创业者中野蛮生长,而不是从大厂内部长出来。 🟢 17:54 大厂 AI 布局 腾讯、字节、米哈游、网易——面对 AI,四家公司走的是四条路。 * 改变最大的一家,并不是资源最多的那家。 * 米哈游做了一件其他纯游戏公司几乎不会做的事情——「动到模型」去做尝试。「技术宅拯救世界」的基因,在这里有多直接的体现? * 世界模型(Genie 3 等)真的要改变游戏了吗? 🟢 22:31 AI 人不懂游戏的三个盲区 * 「游戏生成」这个词,本身就是对游戏工业化难度的低估。 * 视频生成出来就是完成品,但游戏生成出来只是开始。 * 「无限选择,不等于好玩」。 * 我们高估了自然语言在互动娱乐中的比重。手感、点击反馈、声光电刺激——这些跟语言根本没有关系。 * 对于很多内容产品来说,「可生成」是追逐的终点;但对游戏和交互来讲,「可生成」只是可被设计的起点。 🟢 25:15 「AI 时代的抖音」,靠谱吗? Loopit、AIPPY、Rezona、Riffle… 大家都在说要做下一个交互内容平台。 * 创作门槛被极大降低之后,紧接着的问题是? * 有两个核心问题至今没有被解答。 * 「我们俩都生成了一个贪吃蛇,我和你的价值怎么被别人分别看到?」——如果创作者的价值无法被凸显,平台的供给侧会发生什么? 🟢 37:54 TaptapMaker:用过的人两极分化 做过策划的人用它:「太好用了。」没做过策划的人用它:「还不如 Claude Code。」 * 同一款工具,游戏从业者和非从业者体验差距为何那么大? * 有人在上面复刻了 Minecraft 世界,有人做了完整的 Roguelike——原来要一个团队几个人做两三个月,现在一两个人两周。 * AI 互动影游(带分支线的交互视频):比短剧更复杂,成本百倍降低,它的春天什么时候到? * 最长期跟踪的三个问题:交互娱乐里的短内容机会、AI 3D 管线什么时候成熟、以及愤怒的小鸟时刻最终会以什么形式出现。 🟢 43:48 当 Claude Code 成了最好玩的游戏 如果让游戏策划连续说「最近玩过最好玩的游戏」,越来越多的人,答案已经变了。 * 商业化手游的工业节奏(42 天大版本、21 天小版本),是让热爱最容易被消磨的地方。 * 最近好多人说自己最爱的「游戏」是 Claude Code。 * 感性指标和直觉反应,在互动娱乐的早期,为什么比任何理性分析都更重要? 欢迎订阅「十字路口」: 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻

47分钟
4k+
3周前
人类和 AI Agent 的最佳配合方式,还没被发明|对谈 Paperboy

人类和 AI Agent 的最佳配合方式,还没被发明|对谈 Paperboy

十字路口Crossing

🚥 本周,十字路口的嘉宾是 Paperboy(https://www.paperboy.com)团队。John Yang 21 岁,CEO。Jett Chen 19 岁,CMU 大一在读,同时是 founding engineer。Paperboy 团队 12 人,10 位工程师,融资 470 万美金。 John 认为:人类和 AI Agent 配合工作的最佳方式,很可能还没被发明出来。虽然已经有了 Claude Code、Codex、Manus、OpenClaw,但它们本质上都是 session-based + prompt-based。用户需要打开一个窗口,输入 prompt,等完成,关掉。下次从零开始。 Paperboy 正在尝试找到一种更自然、更连续、更可协作的 Agent 界面与记忆结构——Agent 应该通过观察你用电脑来自己学习,用 IM 而不是 session 来组织对话,主动找你,而不是等你 prompt。 如果你在做 AI 产品、AI infra、或正在思考 Agent 如何进入团队工作流,希望这期内容会给你启发。 🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版已发布于 @十字路口Crossing 公众号。 🟢 00:00 快问快答 * 年龄、毕业院校、MBTI 与星座、一句话介绍 Paperboy、融资情况、收入与利润、团队规模、创业前经历 🟢 01:59 起点:现在的 AI 产品,我用着不爽 * 今天的 AI 产品都有一个共同的问题:你必须把文件、邮件、个人信息手动扔进对话框,然后对话完就消失了。 * 三个核心痛点:不该这样协作,不该这样留下历史,不该这样主动。 * 「人类和 AI 配合工作的最佳方式,很可能还没有被发明出来。」 * 现有的 Chatbot 和 Agent 产品形态是 AI 时代的「默认答案」,而默认答案几乎从不是最优解。 🟢 06:21 Claude Code 轰炸之下 * Agent 赛道的三个机会:一,让 agent 真正从用户环境中学习;二,足够个性化,做到主动的同时不造成干扰;三,使用体验必须极其直觉——「你不该像学新工具一样学怎么用它。」 * 这三点依然要靠人类团队,市场上冒出的新东西还没有打破这个框架。 🟢 08:01 Agent 的两大问题 Cursor 和 Manus 是目前最成功的 agent 形态,但 John 说它们有两个根本性的问题——这直接定义了 Paperboy 要做的事。 * 问题一:基于 Session。你有一堆工作区、一堆对话,每次开新 session 就像重新认识一次,context 不跟着你走。 * 问题二:Reactive(被动)。你必须先问,它才回答。Agent.md 文件要主动维护。 * Agent 应该知道你的鼠标移动、视频音频、所有电脑活动——context 应该比 context window 长得多。 🟢 14:21 屏幕数据成了行业共识之后 「收集用户屏幕数据去构建 Context Layer,已经一定程度上成为行业共识。」 * Codex、Littlebird 在做,各路玩家都在做,但接下来怎么做——是预测用户下一个 Keystroke,还是预测他接下来一个小时要做什么——还没有人找到最佳”配方“。 * 这个领域需要大量 engineering 和 research,「在今天,对一家公司来说,探索这个区域还是一个非常好的选择。」 🟢 16:46 Mini Vivian & Auto John * Mini Vivian 是团队在内部 Slack 里训练出来的 Paperboy 实例,理解 Vivian 曾经说过的所有话、她的判断品味、她的招聘标准。 * 它能帮 Vivian 从 GitHub、小红书、推特挖掘候选人。 * 和 Auto John(John 的 agent 分身)聊天,有时候比直接找 John 更顺。 * 「期待我可以直接躺平,让 Auto John 成为比我更聪明的存在。」 🟢 27:36 微信群聊,启发了界面设计 * 不同角色的「侧边栏」完全不同,如果每人一个定制版,根本没法做成产品。 * 转机来自微信——同一批人,可以同时存在于多个主题不同的群组里,这是人类组织信息最自然的方式,而且不会让人觉得烦。 🟢 33:36 The Last Interface 与五种速度 * Paperboy 目前唯一一篇 blog 标题叫「The Last Interface」——context 的速度层级,决定了产品形态。 * 「节奏分层」理论(Pace Layers):时尚、商业、基础设施各自以不同的节奏变化。 * 映射到 AI 产品:1 秒内的 task 可能最好的形式是 autocomplete;几小时的 task 用 IM;更长的 time horizon,产品形态还是「一个非常值得被探索的区域」。 * 「五种速度」不是说 Paperboy 真的只做五种,而是一个思考框架:你在哪个速度层的 automation 上,直接决定了你应该做什么样的产品。 🟢 42:09 两种工程师、一本书、一个教练 * 12 人的团队,John 说他招的是两种完全不同的人。 * 第一种:像 Jett 这样——年轻、高智商、充满创造力,能为每一个难题极速搭出 prototype。第二种:领域基本功极度扎实的人,比如来自 AWS 做过 Windows 内核开发的工程师,来负责底层基建。 * 管理经验几乎全靠自学:《格鲁夫给经理人的第一课》、《创业维艰》、《万亿美元教练》——以及和一位前 VC 高管出身的 CEO 教练每周一小时。 * 找教练比心理治疗好太多,原因是:「你可以谈情绪,然后接着谈业务里正在发生的一切。」 🟢 48:07 拒绝过 Cognition、Vercel、Sentry,然后呢 * Million 时代,他们收到过来自 Cognition(Devin)、Vercel、Sentry 的收购邀约。 * 「加入那些公司,某种程度上就像是做一名普通员工,你必须为别人的想法工作。」 * 最喜欢的 AI 产品?Jett:Codex——「它以最 ambitious 的形式在定义未来的软件工程师是怎么 work 的」,而且核心 agent 是开源的。 欢迎订阅「十字路口」: 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻

55分钟
14k+
1个月前
探秘 Claude Code,搞懂 Agent Harness|对谈来新璐

探秘 Claude Code,搞懂 Agent Harness|对谈来新璐

十字路口Crossing

🚥 为什么说 Agent 的上限来自 Harness?当我们讨论 Harness 时,我们究竟在讨论什么? 不久前,Claude Code 源代码泄露,许多 Agent Harness 的关键模块得以完整呈现,成了一份极佳的教学标本。而在技术高速变化的红利期,主动理解新技术往往能带来很高的认知增量。 因此,本周「十字路口」邀请到来新璐,一起聊聊 Agent Harness。新璐是 ShareAI 开源社区发起人,他撰写维护的《Learn Claude Code》教程在 GitHub 上获得超过 50k Star。 在本期内容中,我们把 Agent Harness 从概念词拆解成工程语言,介绍它的三层框架:会跑(执行层)→ 跑久(状态层)→ 跑稳(治理层)。同时,我们也梳理了 Claude Code 中值得借鉴的多个机制:更多 context、更少 control 的思路、“零上下文管理”的哲学、长程任务的接力式交接策略,以及让 Agent 越用越聪明的“做梦”式记忆维护与迭代机制等 新璐作为典型的一人公司,刚完成数百万美金融资;他也分享了自己对 OPC 的独特观点,甚至认为“未来只有 0 人公司,没有 1 人公司”,颇具启发。 🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版已发布于 @十字路口Crossing 公众号。 🟢 00:49 快问快答:年龄、毕业院校、MBTI、星座、一句话介绍公司、融资情况、团队规模、创业前经历 🟢 01:52 模型以外都是 Harness 机甲、大脑、机器人、智商120——Harness 到底是什么 * 模型以外都是 Harness * Agent 上限由 Harness 决定吗? * 模型智商已在 120–170 之间;Agent Harness 像机甲——不提升智力,但极大扩展能力 🟢 02:47 GitHub 50k star,是怎么来的? 这个Agent教程,其实不只是写给别人看的——它本来是新璐自己整理的"造 Agent 心法"。 * 9 个月前动笔,出发点是"把 Claude Code 套网页壳就能得到一个强大 Agent 产品"的简单直觉 * 开源社区当时流行 LangChain、LangGraph等 prompt pipeline 做法开发“伪Agent”,是一场派系之争——"Prompt Flow-Driven vs Agent Native-Driven" * LangChain 过时了吗? 🟢 04:02 Bash is all you need Claude 推出 Manager Agents 之后,大家还需要自己搭 Harness 吗? * 就像 Next.js出现后大家不再关心底层运行原理,两三年后 Agent Harness 也会收敛为开箱即用 * 但现在是技术周期红利窗口——不懂 Agent Harness,做出来的Agent产品"缺乏灵魂" * 今天的 PM 和过去的 PM,指的根本不是同一种人 🟢 07:04 Harness 三层拆解 用两周时间、多 Agent 协作,从零写出一个 C 编译器——这个经典案例背后,到底走了哪三层? * 第一层:执行能力层 ——文件增删读写、浏览器、语言解释器;配错权限后果是什么? * 第二层:上下文与状态层 ——system prompt、skills、memory,以及上下文窗口满了之后 Agent 如何"接力交棒" * 第三层:治理与编排层 —— 数百上千 Agents 如何组织协作?测试 Agent 为什么不能同时拥有修改代码的权限? 🟢 12:05 KB 的 K 系列Agent工具链 他们公司叫 Komputer Blue,代号KB,目标是构建By Agents & For Agents的整套开源Infra * Komputer:用 TypeScript 重写 Unix 文件系统和 bash,给 Agent 一个"熟悉的生活环境";支持 WebAssembly 时切换WASM实现; * Kruntime:Agent Runtime 层,提供让人类开发 Agent 的接口,以及Agent 派生 Agent的接口 * Kwatch:Agent 观测层,分析 Agent 任务在哪里卡住,反向指导 Agent 设计迭代 * Krl:把 Agent 在 Runtime 上沉淀的轨迹数据拿来强化学习或做上下文层的自迭代 🟢 13:55 vs. AWS AgentCore、阿里云 AgentBay 云服务厂商当然也想做这一层 * K 系列 Agent 工具链的核心理念:在离用户更近的场景运行 Agent,任何能跑 JavaScript 的场景都能用——浏览器、插件、App、Electron、小程序、纯静态网页、全栈 SaaS * 差异化:把Claw-Agent的运行时轻量到由纯数据结构模拟的 KB 级Unix虚拟计算机环境,而不是把 Linux 和浏览器全塞进去 * 新璐认为要让 Agent 工作好的方法是给每个 Agent 一台专用计算机,一般通过虚机提供,但大多 Agent 完成的大部分工作不需要真的 Linux虚机(且成本高昂),像编译器、浏览器这类重工具原本就不该放进给每个 Agent 的虚机环境 🟢 17:38 Memory 的流派 * 完全结构化(知识图谱 + 向量搜索):精细存储的知识结构,支持 pipeline 知识推理,rule-based,新璐不喜欢 * 半结构化(Unix Files + Markdown + Agent 驱动更新):Claude Code 和小龙虾都是这样做的;Claude Code 中的 auto-dream 机制:每隔一天触发后台 Agent 对最近会话做"重放",纠错、合并、更新记忆——就像做梦 * 模型内化 —— 距真正生产落地还需要~ 3 年时间,且记忆难批量提取 & 无损转移,容易被单边模型提供商绑定 🟢 22:49 共识与非共识 * 共识:CLI is all you need——"Bash is all you need" 这句话是新璐 9 个月前写在开源仓库里的标语,现在成了行业共识 * 非共识:大部分23年 ~ 25年诞生的主流开源 Agent 框架仍在用 PromptPipe + Node Graph的老路线 —— 就像齿轮与传送带编织的流水线 * Unix 从 1971 年就存在,LLM预训练语料中 Linux 命令有数十亿条sample;MCP 提出才两年,预训练占比不到 0.1%——这解释了为什么 CLI 工具的任务完成率比 MCP 高,并且 shell 具备对CLI命令的可组合性 & 二次编程空间 🟢 26:33 Claude Code 源码泄露:最大的惊喜是什么 让所有人看到了一件事:这家公司在"上下文管理"上做了多少别人没有做的工程工作 * 上下文压缩策略:工具 output 何时删、窗口满到什么阈值开始交接、下一个 Agent 初始化时加载什么 * Fork Agent 机制:每轮结束触发 turn stop hook,Fork 一个 Agent 复用 KV cache 做记忆更新 * 记忆文件格式和 skill 保持同一套哲学:前三行 YAML,先读 description 而非全文 * 新璐的结论:"好的 Harness 要和模型的inference逻辑自洽,和Agent模型进步方向正交" 🟢 34:05 好 Harness 的标准 * 不好的:随意裁剪上下文,导致 KV cache 频繁失效,重计算开销 * 不好的:用 Prompt Graph硬控每一步决策——模型越强越被束缚 * 好的公式:好的context space + 好的action space + less prompt control * Anthropic 从25年初率先从问答模型转向 Agent 模型训练,领先其他厂商半年 🟢 38:52 新璐看好的三个创业方向 * 第一:Agent Harness工具链(新璐自己在做) * 第二:Agent 组网——不是给 Agent 发 IM/Mail,而是混合云端/端侧的全设备组网;现有 Tailscale 不够 Agent Native,需要高通量上下文交换,以及更多控制能力 * 第三:Agent模型集约训练、推理基础设施——Tinker(Thinking Machines Lab,OpenAI 前 CTO 创业方向)的路线:集约化高效训练 + LoRA 热插拔推理,让更多企业 & 个人都能以较低成本获得个性化且更适合各自任务场景的Agent模型 🟢 44:09 Agent 未来暴论 "我觉得以后很多的公司都是理财产品 —— 由有经验的人类 Team搭建这些公司、甚至由AI直接生成公司,然后自运转" * 阶段:单 Agent → Agent 蜂群 → Agent 自管理 & 协调更多 Agent → Agent 开始创造、发明 * OPC “1人公司“不本质, 0PC “0人公司”是未来趋势 * 真格基金和十字路口的 Token Grant 资助的 YoYo Agent * 未来的画面:从口袋里掏出一张卡,"这张卡里跑了 5 个由Agent组成的公司,每年给我创造几十亿收入" 欢迎订阅「十字路口」: 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻

47分钟
30k+
1个月前
评价

空空如也

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧