https://babi.com/

科技慢半拍 - #120 从考场到职场|AI智能体的新摩尔定律 - EarsOnMe - 精选播客,一听即合
Album
时长:
41分钟
播放:
150
发布:
1周前
主播...
简介...
https://xiaoyuzhoufm.com
【节目介绍】
别再盯着那个大模型榜单了!当所有AI都在榜单上刷出惊人高分,我们该如何判断,谁才是真正能解决问题的“智能体”?AI评估的战场,正从静态的“考场”移向动态的“职场”。一场关于“任务地平线”的竞赛已经开始——衡量标准不再是“知道多少”,而是“在没有人类干预下,能独立、可靠地工作多久”。这场评估中,我们发现了一条属于AI智能体的新摩尔定律。这不仅仅是一次技术指标的更替,它正在重新定义工作的边界,并悄然拆解我们熟悉的职业阶梯。本期节目,我们将穿透分数的迷雾,直抵AI能力演进的核心战场,探寻那条决定我们与AI如何共生的关键曲线。
【时间线】
01:03 现有的AI评估方法
11:46 METR的“任务地平线”测评
14:20 任务成功率的半衰期
22:57 “马拉松”式的职场模拟器
24:30 AI智能体的新摩尔定律
26:36 智能体能力提升的三大引擎
33:22 对人类职场的影响
【PPT讲稿】
【参考资料】
AI Futures Project
【片头片尾音乐】
软柿子乐队(Soft Persimmon) - 你好,乌龟
【感谢】
特别感谢[AIGC开放社区]和[AI重塑世界]的大力支持,请听友及时订阅微信公众号,查看本播客的文字版内容。欢迎订阅本播客节目,本节目在小宇宙、喜马拉雅、苹果播客、蜻蜓FM、网易云音乐、荔枝FM等平台均已上线。
评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧