主播
节目简介
来源:小宇宙
本期解读:海外独角兽《Harness is the New Dataset》
这篇文章综合了 Anthropic、OpenAI、Google 等一线团队的实践经验,系统梳理了 Harness Engineering 这一 2026 年 AI 工程领域最热的概念。Harness 是模型周围的外围系统,决定了 agent 能看到什么、能用什么、失败时该怎么办。
🔥 本期核心内容
1. Harness 是什么:给 AI 套上马具
Agent = LLM + Harness|AI 工程三次演进:Prompt → Context → Harness|标志性事件:2025 年 11 月 Claude Opus 4.5 发布,「用好模型」开始比「提高模型」更重要
1. 6 个组件,3 层架构
信息层(记忆与上下文管理、工具与技能)→ 执行层(编排与协调、基础设施与保障)→ 反馈层(评估与验证、追踪与观测)|Openclaw 案例:harness 设计创造出模型本身给不了的「生命力」
1. 7 个设计原则精华
渐进式披露:信息分层加载,不一次性全塞给 AI|工具少而精:Claude Code 只有约 20 个工具|研究→计划→执行→验证分离:Boris Cherny 的 context firewall 方法|反馈闭环:Mitchell Hashimoto 的「每次犯错都工程化」原则
1. 模型与 Harness 的共生关系
训练即部署:Cursor、Windsurf 用真实环境训练模型|Harness 即数据:执行轨迹才是真正的竞争壁垒|Anthropic 领先几个月的窗口期,造就了 Claude Code 的生态优势
💡 对游戏/科技从业者的启示
* AI 落地效果不好,问题往往不在模型,而在周围系统——评估你团队 AI 工具的 harness 成熟度
* 用「研究→计划→执行→验证」重构 AI 辅助工作流,不要甩大需求给 AI
* 建立团队级经验沉淀文档(类似 AGENTS.md),让 AI 工作流也有复盘机制
📌 关于我
我是 Hao,游戏行业项目管理从业者,9 年经验。这档节目是我的"学习笔记",把有价值的深度内容消化成中文播客,带上我自己的视角和思考。如果你也对 AI、科技趋势、项目管理感兴趣,欢迎订阅 🎧
🔗 延伸内容
* 游戏项目管理进阶课程:https://j6cuy7img2.feishu.cn/wiki/S86kw6fkKi2l6SkjC2mcGQoYnHd
* 模拟面试 / 简历优化服务:https://j6cuy7img2.feishu.cn/wiki/Dgz3wQ1lWidUzBkEPORczpyXnAe
* 游戏 PM 成长社区(含工作思考与案例沉淀):https://j6cuy7img2.feishu.cn/wiki/KO1ewUTThi6nYpk79jAc94dmnMg
这篇文章综合了 Anthropic、OpenAI、Google 等一线团队的实践经验,系统梳理了 Harness Engineering 这一 2026 年 AI 工程领域最热的概念。Harness 是模型周围的外围系统,决定了 agent 能看到什么、能用什么、失败时该怎么办。
🔥 本期核心内容
1. Harness 是什么:给 AI 套上马具
Agent = LLM + Harness|AI 工程三次演进:Prompt → Context → Harness|标志性事件:2025 年 11 月 Claude Opus 4.5 发布,「用好模型」开始比「提高模型」更重要
1. 6 个组件,3 层架构
信息层(记忆与上下文管理、工具与技能)→ 执行层(编排与协调、基础设施与保障)→ 反馈层(评估与验证、追踪与观测)|Openclaw 案例:harness 设计创造出模型本身给不了的「生命力」
1. 7 个设计原则精华
渐进式披露:信息分层加载,不一次性全塞给 AI|工具少而精:Claude Code 只有约 20 个工具|研究→计划→执行→验证分离:Boris Cherny 的 context firewall 方法|反馈闭环:Mitchell Hashimoto 的「每次犯错都工程化」原则
1. 模型与 Harness 的共生关系
训练即部署:Cursor、Windsurf 用真实环境训练模型|Harness 即数据:执行轨迹才是真正的竞争壁垒|Anthropic 领先几个月的窗口期,造就了 Claude Code 的生态优势
💡 对游戏/科技从业者的启示
* AI 落地效果不好,问题往往不在模型,而在周围系统——评估你团队 AI 工具的 harness 成熟度
* 用「研究→计划→执行→验证」重构 AI 辅助工作流,不要甩大需求给 AI
* 建立团队级经验沉淀文档(类似 AGENTS.md),让 AI 工作流也有复盘机制
📌 关于我
我是 Hao,游戏行业项目管理从业者,9 年经验。这档节目是我的"学习笔记",把有价值的深度内容消化成中文播客,带上我自己的视角和思考。如果你也对 AI、科技趋势、项目管理感兴趣,欢迎订阅 🎧
🔗 延伸内容
* 游戏项目管理进阶课程:https://j6cuy7img2.feishu.cn/wiki/S86kw6fkKi2l6SkjC2mcGQoYnHd
* 模拟面试 / 简历优化服务:https://j6cuy7img2.feishu.cn/wiki/Dgz3wQ1lWidUzBkEPORczpyXnAe
* 游戏 PM 成长社区(含工作思考与案例沉淀):https://j6cuy7img2.feishu.cn/wiki/KO1ewUTThi6nYpk79jAc94dmnMg