Hao的游戏PM笔记 - 第156期 - AI预算这笔账，该怎么算 - EarsOnMe

主播

节目简介

来源：小宇宙

📝 本期摘要
Token消耗量正在成为衡量团队AI化程度的核心指标，但这个指标可能完全是错的。Meta内部搞了Token消耗排行榜，覆盖8万多员工，排名第一的人烧掉了价值数百万美元的Token。Hao结合自己游戏团队的管理经验，拆解了为什么Token总量是一个误导性指标，提出了Token per task（每任务Token消耗）作为更合理的度量方式，并分享了"越贵的模型反而越省钱"的反直觉发现和混合调度策略的实操经验。
❓ 本期讨论了这些问题
* 为什么Token消耗量不能作为团队AI水平的衡量标准？
* 什么是Token per task，它为什么比Token总量更重要？
* 为什么越贵的AI模型在Agent场景中反而总成本更低？
* 游戏团队的AI预算应该怎么拆分和管理？
* Token按量计费的模式未来会怎么演变？
🔥 本期核心内容
1. Token消耗量是输入指标，不是产出指标

Meta的Token排行榜覆盖85000名员工，月消耗突破60万亿Token。行业估计当前企业AI应用中近一半Token没产生实际价值——Agent会反复读取整个对话历史、重新扫描已处理文件，冗余信息像滚雪球一样增长。用Token消耗量当KPI，就像用加班时长当产出指标。
2. Token per task才是正确的度量方式

同一个任务，不同模型的Token消耗差距可达几十倍。差距来自三个层面：输出长度差异（强模型100行vs弱模型几百行）、隐藏的推理Token、以及Agent loop的放大效应（20轮vs3轮）。按任务类型分类追踪，看同类任务平均Token的涨跌趋势，才能判断AI用法是否在优化。
3. 越贵的模型反而越省钱——混合调度是解法

强模型一次做对，弱模型来回迭代十几轮，综合Token消耗反而更高。实操经验是混合调度：复杂任务用强模型（贵但准），简单任务用便宜模型（够用就好），重复性任务特别适合便宜模型（速度快比聪明重要）。单价低≠总成本低，和项目管理里"便宜外包"踩的坑一样。
4. PM管AI预算的三个实操动作

按职能拆预算而非一个总数大家抢（Uber CTO的教训：几个月花完全年预算）；设置单任务Token阈值防止Agent跑偏；每周复盘Token/产出比，发现同类任务平均消耗上涨时及时排查。Token按量计费可能不是终态，按效果付费的模式已经在客服等可量化场景跑通。
🏷️ 本期提到的人物与概念
人物：N/A
公司/产品：Meta, Claude Code, Anthropic
概念：Tokenmaxing, Token per task, 混合调度 / Mixed Model Routing, 按效果付费 / Outcome-based Pricing, Agent Loop
📌 关于我
我是 Hao，游戏行业项目管理从业者，10年经验。
课程 · 咨询 · PM成长社区 → pmnote.ai

第156期 - AI预算这笔账，该怎么算

加入我们的 Discord

扫描微信二维码

播放列表