Hao的游戏PM笔记 - 第155期 - 从Demo到量产：AI在游戏行业落地的真正难关 - EarsOnMe

主播

节目简介

来源：小宇宙

📝 本期摘要
本期聊了AI在游戏行业从Demo走向量产面临的核心挑战。从"试十遍成一遍"和"说十遍都得成"的认知差距说起，探讨了脚手架工程（Harness Engineering）为什么比模型本身更决定AI能不能上线、大模型幻觉在游戏场景中的事实锚定方案、速度-成本-效果的不可能三角及分层架构解法、build to delete的AI工具链心态，以及评测体系这个被严重低估的量产基础设施。核心观点：模型能力不是瓶颈，围绕模型搭建的工程保障体系才是AI能否真正进入游戏生产管线的关键。
❓ 本期讨论了这些问题
* AI Demo和量产之间的差距，本质上是什么差距？
* 为什么同一个模型换不同的脚手架设计，任务完成率能差40个百分点？
* 游戏里的AI幻觉问题，为什么比聊天场景严重得多？
* 速度、成本、效果——AI量产的不可能三角怎么破？
* 游戏团队应该用什么心态来搭建AI工具链？
🔥 本期核心内容
1. Demo思维和量产思维的根本区别是上限vs下限

Demo追求的是让人看到"AI能做到什么"，量产追求的是确保"AI不会搞砸什么"。游戏开发对下限极其敏感——一个NPC说了句不该说的话，截图就在玩家社区传开了。在Demo里失败可以被隐藏，在量产里每次失败都是体验事故。
2. 脚手架工程（Harness Engineering）决定了AI能不能真正上线

围绕大模型搭建的保障体系——意图识别、世界观约束、内容安全、记忆管理、降级兜底——才是真正的工程量。研究发现同一个模型换不同脚手架设计，任务完成率差距可达40个百分点。模型是大脑，脚手架是神经系统和骨骼。
3. "意图与事实分离"是游戏AI的必守原则

让AI负责理解玩家意图，让游戏数据负责事实。AI可以组织语言、调整语气，但坐标、NPC状态、物品属性这些事实性信息必须从游戏数据库里查，不允许模型自己编造。
4. build to delete——AI工具链应该当脚手架而不是地基

AI能力以月为单位进化，今天花两个月搭的系统可能三个月后就过时了。保持轻量、保持可替换，用效果来判断什么时候该加约束、什么时候该放开。评测体系要在AI功能设计阶段就前置规划，不能等上线了再想。
🏷️ 本期提到的人物与概念
概念：脚手架工程 / Harness Engineering、AI幻觉 / AI Hallucination、意图与事实分离 / Intent-Fact Separation、build to delete、不可能三角 / Impossible Triangle、评测体系 / Evaluation System、快思考+慢思考 / Fast & Slow Thinking
📌 关于我
我是 Hao，游戏行业项目管理从业者，10年经验。
课程 · 咨询 · PM成长社区 → pmnote.ai

第155期 - 从Demo到量产：AI在游戏行业落地的真正难关

加入我们的 Discord

扫描微信二维码

播放列表