Album

AI闹

100个AI创造者

张卓 张卓
2,106 订阅 19 集 1周前
播客简介
和我们一起发现AI时代最重要的创造者。 记录AI如何重塑一代人的生活 主理人 张卓 前《人物》副主编、 36氪副总裁、100+潜水员及永不退役的足球手 松岛兔 前资深媒体人、现金融行业从业者 、环游世界及公路车爱好者
节目

#19从认知科学到视觉AI:我们如何教AI「看懂」世界?

AI闹

想象一个场景:你坐在曼谷一家餐厅,手机对准一张泰语菜单:2026年的AI不仅能把泰文翻译成中文——这已经像是上个时代的把戏了——它还能记住你是素食主义者,从二十道菜里挑出那三道不含肉的,用标准泰语帮你点单,顺便把附近评分最高的甜品店塞进你的下午行程。 如今的AI视觉已经发展成不仅能准确识别事物,还能理解「你为什么要看拍这个东西」,以及「接下来你想要干嘛」。 今天我们访谈的Chance AI的创始人曾熙,就是一个试图为AI打造视觉大脑的人,这也是AI行业当下最新的发展趋势:VLM应用. Chance AI的产品逻辑很简单:用户拍照,APP自动识别,然后给出解释。 听起来有点抽象?我们简单拆解一下。 假设你随手拍了一张演唱会海报。对Chance AI来说这不只是「一张印着字和图案的纸」,而是: 这是什么演唱会?(识别视觉信号) 你是这个歌手的粉丝吗?(个性化上下文) 票好买吗?值得去吗?(社会共识) 然后,推导出行动: 什么时候开票? 要不要帮你加进日历? 开票当天是否设置提醒? Chance AI上线一年,目前已经积累了20万用户,其中40%在北美。 在技术底层,他们做了一个反共识的选择,用生物学视觉原理作AI的视觉Agent,这是一个跨学科的解释工作,「行业现在最大的误区,是试图用一个模型解决复杂的视觉推理,这是不可能的。」 曾熙:巴塞罗那读认知科学与当代艺术博士,研究的问题是「为什么人类看到毕加索蓝色时期的画会感到忧郁?」 其的原理其实非常硬核,触及了人类视觉系统的本质:我们的大脑把视觉信号转化成情绪、记忆、意义。 毕业后,他先后在一加、OPPO工作,最后一份工作是在字节跳动的Flow团队担任高级总监——豆包的拍照功能就是他主导的。 他身上有种奇妙的混搭气质。能用神经科学术语解释视觉皮层的工作原理,也能用黑色讲英国皇室和中国皇室的审美哲学,会用硬件行话聊供应链和PMF,同时喜欢橘子海,一支只唱英文歌的山东青岛籍乐队。 2024年,当GPT-4o多模态模型出世时,曾熙收到了一个明确的信号——这个技术方向正接近他博士期间研究的问题:人类的视觉系统如何生成意义。 00:00 为何AI那么难看懂世界? 03:57 为什么我要离开豆包? 09:52 一次展览诞生了创业demo:安迪沃霍尔给我带来1000个种子用户 14:36 视觉语言模型VLM:从视觉识别到视觉推理的技术质变 19:23 如何让AI长出会思考的眼睛:韦伯伦效应,上下文、社会共识和品牌资产。 24:42 颜色的社会意义与技术延续行动 29:22 Chance AI竟然没有中年人在用。 33:18 人类的审美是如何被AI决定 36:07 参考人类的视觉系统:四步搭建视觉Agent 41:37 为什么婴儿毫秒之内就能懂热水不能碰,而AI不能。 47:02 语言起源与视觉交互:这是下一个入口吗? 53:41 未来Agent OS是啥样? 剪辑:张超辉 插画: Youmind

61分钟
92
1周前

#18 被陆奇称赞最有「硅谷产品Sense」的创业者:软件会消失,我们被SaaS思维骗了很久

AI闹

张浩然,一个陆奇曾多次在内部称赞他是「最有硅谷产品 sense」的 Founder。 他因为跳街舞大学辍学,之后自学成才,从产品交互入行,先后两次创业,都获得了奇绩创投的投资。 认识浩然是朋友介绍,看了他的公众号,有很多非常深入浅出的思考。由于历经过AI全栈建构,张浩然对Agent有很多独特的观点。比如他认为现在的 Saas软件是企业效率的最大杀手,Agent用聊天做交互本质是一种糟糕能力的体现,让用户体验好的产品应该是意图驱动,,就是用户开口说一句话,就能交付完整的结果,用户不需要思考中间过程。 2024 年冬天因为「不想错过 AI」,张浩然从飞书辞职,下场服务了十几家出海落地 AI ,参与设计了包括 Fellou AI 浏览器在内的几个 Agent 应用 ,在 今年决定自己创业,做一款颠覆微软的产品。 这是张浩然第一次对外详细阐述新产品「Agencize」,正式版计划在2026年4月上线。 时间轴: 02:50 SaaS 是旧时代的产物 06:43 一个典型的电商场景 09:52 Agent与业务Know-How的思考 13:56 从街舞少年到产品经理 20:59 第一次创业和奇绩的故事 22:55 离开飞书那一刻:我果真是我 26:41 与谢扬和王登科的战友情 32:41 为什么 Agent产品一定用对话交互?过去的体验太糟糕 38:25 和陆奇的故事 48:04 挑战微软,消灭八小时工作制。 延伸阅读 被陆奇称赞最有「硅谷产品Sense」的创业者要改写「微软」定义的世界 张浩然分享:一个AI Native必备的四种底层产品能力 其他 本期音乐:来自张浩然的推荐《Mama Said Knock You Out》 本期剪辑:孙晟钧Lufus

51分钟
99+
5个月前

#17 Agent 下一阶段的关键要素:可解释、造工具和 100% 确认美学

AI闹

Agent 如今的关键是「谁能造出一个真正有用的Agent?」 行业讨论的焦点变成「Agent的认知边界」:它应该有多大的自主性?需要多强的上下文理解?又如何在现实任务中保持稳定?这背后需要实践者具备四种超强的能力:即对模型的边界预估,对复杂系统的理解力、对产品工程的实践力,以及对商业场景的洞察力。 本期我们邀请到的嘉宾是 Sheet0.com 的创始人王文锋,在他看来Agent本质上是一种「利用模型知识,结合实时信息,使用工具解决问题」的产品形态。 他在行业里提出了一个关键问题是:为什么模型本身已经达到博士水平,但很多 Agent 的表现仍停留在实习生阶段? 这中间的 GAP关键在于在「实时信息」和「工具设计」并没有很好的适配模型能力。 Sheet0.com 就是他对Agent的一次认知落地:一款在 AI 时代为模型提供可扩展的实时数据获取能力的产品。今年8月中旬,产品上线, 主要面向数据分析师、产品经理、工程师、市场营销人员等在数据收集处理上花超过5个小时的用户。 一个典型的用户场景:一位销售在寻找潜在 AI 行业客户,过去,他要先通过LinkedIn、X等社媒,收集公司信息,再分析该公司是否为 AI 行业公司,还需要寻找目标联系人联系方式等等。而搭建这样一个程序,需要一个工程师4-8周的时间。 《Tech Crunch》认为 Sheet0 是「工程派 Agent」的代表,评价是「一款让 AI 更透明的工程产品」。而让 Agent 变得可解释,是 Agent 下一步发展的关键环节。 王文锋:AI 闹收藏的第18个 AI Creators; 作为连续创业者,在Data Infra、AI领域积累了近十年的开发经验。2023年加入 AI 浪潮。 AI 闹见到王文锋时,他刚从美国回来,时差还没有完全倒明白,我们的话题围绕在 sheet0上线两个月后,他对 Agent 的最新思考,以及他少见的谈了了谈自己创业三年的至暗时刻。 王文锋 产品界面 时间轴 02:56 最出乎意料的是日本用户付费意愿高吗,不会主做中国市场。 07:46 过去造一个舆情系统需要工程师3-4周,现在只需要30分钟,那这个需求一定放大100倍。 12:25 Agent的三大核心要素:模型、环境反馈和工具使用,怎么做?谁是最好的参考? 17:08 我们如何做到100%保证准确?没有任何模型幻觉问题。 21:12 发现了一个极大的数据场景,商业价值比肩谷歌。 26:15 因为不信任模型,我创业失败了两次。 32:05 王文锋的至暗时刻:抑郁,母亲去世,没有新方向。 33:19 2026年 Agent的核心要素,以及从美国回来的创业思考。 延伸阅读 王文锋完整版文字请关注「AI闹的公众号」 王文锋之前的采访在42章经

35分钟
99+
7个月前

#16 月薪500美元,博士生,一个AI员工的进化和缺陷|和Lucius创始人赵赫聊聊AI Native组织的范式变化

AI闹

为什么 AI 那么厉害,但是能真的解决问题的 AI 员工还没有出现? 很多人对「AI 员工」的失望来自于出实际管理成本比真人好高, 基于此,赵赫决定做一个能让企业直接用的AI员工。 500美元一个月,不需要客户自己写文档,自己配置,自己训练,他直接训好一个AI员工交付给客户。 博士生水平。 第一个切入的场景是海外社区运营的,大概2周就能接管一家公司的运营团队。 他的理念是,柿子要挑软的捏,AI 最先取代的一定是组织里最弱色」,比如有「固定工作套路」的白领工种。 这句话虽然让人类感受到威胁,但赵赫认为,AI取代的是重复的,繁琐的,没有成长空间的工种,比如外包。 而有人类可以节省出更多时间,做有价值的创造。 本期节目,AI闹和赵赫聊了聊AI员工的工程细节,垂类Agent的能力和缺陷,以及随着AI员工进入企业有哪些组织形态会发生变化。 Lucius 在拉丁语是光的意思,蝙蝠侠的管家也叫 Lucius。「懂 DC 文化的人,一看就知道我们在做什么。」 本期人物 张卓,AI闹主理人,前36氪副总裁,《人物》副主编 赵赫:Luicus CEO 主要话题 09:19 AI员工「自我学习」的能力是如何打造的?懒是时代最大的问题 16:19 柿子要捡软的捏,重复的工作看不到希望 21:14 客户竟然把自己公司的人才推荐给我了,他说,因为你们的AI员工我是绝对不会开除的 26:04 增速是这个月10家,下个月1万家,我做的就是行业的非共识 34:23 小米的王川天天喷我 延伸阅读 AI闹的报道 幕后制作 制作:张卓 加入AI闹社群

36分钟
99+
7个月前
评价

空空如也

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧