第156期 - AI预算这笔账,该怎么算
Hao的游戏PM笔记

第156期 - AI预算这笔账,该怎么算

7分钟 16 5天前
节目简介
来源:小宇宙
📝 本期摘要
Token消耗量正在成为衡量团队AI化程度的核心指标,但这个指标可能完全是错的。Meta内部搞了Token消耗排行榜,覆盖8万多员工,排名第一的人烧掉了价值数百万美元的Token。Hao结合自己游戏团队的管理经验,拆解了为什么Token总量是一个误导性指标,提出了Token per task(每任务Token消耗)作为更合理的度量方式,并分享了"越贵的模型反而越省钱"的反直觉发现和混合调度策略的实操经验。
❓ 本期讨论了这些问题
* 为什么Token消耗量不能作为团队AI水平的衡量标准?
* 什么是Token per task,它为什么比Token总量更重要?
* 为什么越贵的AI模型在Agent场景中反而总成本更低?
* 游戏团队的AI预算应该怎么拆分和管理?
* Token按量计费的模式未来会怎么演变?
🔥 本期核心内容
1. Token消耗量是输入指标,不是产出指标

Meta的Token排行榜覆盖85000名员工,月消耗突破60万亿Token。行业估计当前企业AI应用中近一半Token没产生实际价值——Agent会反复读取整个对话历史、重新扫描已处理文件,冗余信息像滚雪球一样增长。用Token消耗量当KPI,就像用加班时长当产出指标。
2. Token per task才是正确的度量方式

同一个任务,不同模型的Token消耗差距可达几十倍。差距来自三个层面:输出长度差异(强模型100行vs弱模型几百行)、隐藏的推理Token、以及Agent loop的放大效应(20轮vs3轮)。按任务类型分类追踪,看同类任务平均Token的涨跌趋势,才能判断AI用法是否在优化。
3. 越贵的模型反而越省钱——混合调度是解法

强模型一次做对,弱模型来回迭代十几轮,综合Token消耗反而更高。实操经验是混合调度:复杂任务用强模型(贵但准),简单任务用便宜模型(够用就好),重复性任务特别适合便宜模型(速度快比聪明重要)。单价低≠总成本低,和项目管理里"便宜外包"踩的坑一样。
4. PM管AI预算的三个实操动作

按职能拆预算而非一个总数大家抢(Uber CTO的教训:几个月花完全年预算);设置单任务Token阈值防止Agent跑偏;每周复盘Token/产出比,发现同类任务平均消耗上涨时及时排查。Token按量计费可能不是终态,按效果付费的模式已经在客服等可量化场景跑通。
🏷️ 本期提到的人物与概念
人物:N/A
公司/产品:Meta, Claude Code, Anthropic
概念:Tokenmaxing, Token per task, 混合调度 / Mixed Model Routing, 按效果付费 / Outcome-based Pricing, Agent Loop
📌 关于我
我是 Hao,游戏行业项目管理从业者,10年经验。
课程 · 咨询 · PM成长社区 → pmnote.ai

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧