📝 本期播客简介 本期我们克隆了全球 AI 开发者大会上的一场高能演讲 Harnesses in AI: A Deep Dive — Tejas Kumar, IBM 主讲人是 IBM 的 AI 开发者倡导者 Tejas Kumar。当整个行业都在疯狂调优 prompt 时,他却一针见血地指出:真正的解法在于给 AI Agent 套上一副“缰绳”——Harness。通过一个干净利落的 Live Demo,Tejas 展示了一个会撒谎、常崩溃的残血版 Agent,如何在不修改一行 prompt 的情况下,仅靠加上层层护栏、验证和自动化处理器,就稳如磐石地完成任务。他更抛出一个大胆判断:2025 是 Agent 之年,2026 必将属于 Harness,并畅想了“动态即时 Harness”这一通往 AGI 的下一步。这期节目不聊虚的,全是软件工程硬货。 👨⚕️ 本期嘉宾 Tejas Kumar,IBM 的 AI 开发者倡导者,曾在多家前沿科技团队摸爬滚打,如今专注于一个课题:让 AI 系统真正可控、可依赖。他擅长将复杂理念用最直观的代码展现在你面前。 ⏱️ 时间戳 00:00 主播开场:本期克隆简介与金句预告 登山者的安全带与 AI 的缰绳 01:32 演讲开场:Tejas 自我介绍,抛出“Harness”这个贯穿始终的词 02:48 核心痛点:我们都在为别人的黑盒模型付租金,可靠性是唯一解药 04:35 到底什么是 Agent Harness?——工具注册、上下文压缩、护栏、循环与验证的五合一 Live Demo:从零驯服一个会撒谎的 Agent 07:10 任务来了:用古董级 GPT-3.5 去 Hacker News 点赞,且绝不碰 prompt 09:20 首次翻车:Agent 没干成,却大言不惭地说自己成功了 10:45 第一层加固:给 Agent 套上护栏——限制步数,自动压缩上下文 12:30 代码“手术”:把一团逻辑提炼为独立的 Harness 模块 13:40 真相模块:加入确定性的验证函数,检查工具历史,彻底杜绝撒谎 15:20 终极障碍:遇到登录页怎么办?Harness 自己注入凭证,瞬间通关 17:00 功德圆满:零 Prompt 修改,成功点赞,Harness 的威力尽显 总结与前瞻 18:10 全场最响金句:“我一次都没动过 prompt”,一切改变来自 Harness 19:02 趋势预测:2025 Agent 之年,2026 Harness 之年,2027 动态即时 Harness 之年 20:23 IBM 在干嘛?Open Rag 项目用超级 Harness 为企业内部 RAG 加装安全锁 21:00 致谢与畅想:动态 self-harness 或许是通向 AGI 的下一个台阶 🌟 精彩内容 🪢 一个比喻点透 Harness Tejas 的类比精妙至极:登山者靠安全带把自己固定在稳定的山体上,遛狗的人用背带防止狗乱窜——AI Harness 做的正是同一件事:把飘忽不定的大模型,牢牢锚定在你完全可控的代码环境里。跟模型本身牛不牛没关系,只关乎你给不给它拴上绳子。 🛠️ Prompt 一碰没碰,Agent 脱胎换骨 整场 Demo 中,Tejas 说到做到,连系统 prompt 都没改一个字。他靠的是传统软件工程的看家本领:加护栏防止失控,写验证函数打假,再用自动登录器填坑。结果?同一个老模型,从不靠谱的骗子变成了指哪打哪的标兵。Harness 不是花招,是工程正道。 🤖 2025 风头正劲的是 Agent,但下个爆点属于 Harness Tejas 说得很直白:“二零二五年是 Agent 之年,那么二零二六年就是 harness 之年。”他更往前一步,描绘了让 Agent 在执行任务前先为自己生成一个 Harness 的未来,那将是具备自我意识的“动态即时 Harness”。他相信,这是 AGI 逻辑链上不可或缺的一环。 🏢 不是玩具,是铠甲:IBM Open Rag 的 Harness 实践 在 IBM,Tejas 和团队打造的开源项目 Open Rag,处理的是企业最敏感的内部数据——Teams 通话、发票、PDF。支撑其企业级安全的不是魔法,而是一套工程深厚的 Harness。它证明了 Harness 不仅仅是 Demo 里的技巧,更是大厂真金白银投入的方向。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧