你喜欢的节目都在这里
《给阿嫲的情书》以克制的情感表达传递出了无声的力量,引发了众多共鸣。“江海万里,心中念你”成为了承载跨越南洋的相思符号。电影如何依靠克制的情绪传递情感的共鸣?电影中“有情有义”的人物关系又特别在哪里?时代背景又如何影响了主人公的个体命运?这期节目,我们尝试关注眼泪背后的力量和故事。 02:52 克制的情绪如何传递情感的重量? 03:37 淑柔收到“全家福”:针线活与屋外的大雨,情绪与还要继续的生活。 07:18 淑柔知道真相:橄榄菜与要穿过的弄堂,手边的事和五十八年的过往。 13:30 失忆与咸猪肉:当记忆消散,过去真的成为过去,但未来还将到来。 18:00 克制的重量,来自【真实】和给观众带入的空间。 22:06 有情有义:【行动】先于【身份】的关系建构 22:24 木生与南枝:依靠共同生活的情义构建的关系。 25:00 南枝与淑柔:依靠共同守望与责任构建的关系。 30:45 时代与个体命运:殖民体系下的华工与族群矛盾。 本期主播:kantwyn 片头、片尾曲:《给阿嫲的情书》主题曲——《月下煮茶》,陈佳 本期节目录制在【北京市-大小咖啡(麦子店)】,一个有趣的咖啡馆,一个舒适的播客创作空间,欢迎感兴趣的听友前往玩耍~
本期节目综述: 5月份是国际大宗商品、地缘政治集中剧烈变化的一个月。美伊冲突的变量导致原油的价格依然扑朔迷离,来回激荡。AI 的板块轮动这次来到了存储概念,在美股和国内的二级市场,相关的芯片配套硬件公司股价迎来了一波暴涨。在日本,7-11 的创始人伊藤雅俊因心力衰竭离世,而他一手创办的日本 7-11 也在面临和当年美国 7-11 破产时一模一样的故事——恶意收购。国内跨境券商机构迎来了大额罚单,伴随着美联储加息的预期,可能中概股会变成最大的受害者。 🕕时间线: 00:25 半导体狂飙和AI概念轮换 11:08 原油高位震荡,“三桶油”股价稳定下跌 15:49 跨境券商巨额罚单 21:54 日本711创始人离世,公司恐陷入分裂 30:32 美联储的加息逻辑 晨钟暮股是一档投资陪伴类的播客节目。欢迎在小宇宙、苹果PodCast、网易云等平台订阅。 本节目内容不构成任何投资建议。
附上 5 月 29 日快讯图,一张图看懂今日所有重点!在小宇宙查看该单集文稿
·【00:56】嘉宾介绍:手语星球的闪电超人 ·【02:19】致力科普手语文化与聋人文化 ·【04:36】从大一学习手语到B站20万粉 ·【07:30】“你可以开始刷牙了”热梗诞生:纠正手语书的创意 ·【11:32】视听双障人士现状 ·【14:09】中外观念差异:生活技能重建 VS 高考焦虑 ·【18:34】触觉手语的沟通方式:如何通过触摸传递表情 ·【25:55】流量大V的变现尝试 ·【30:08】被白嫖经历:如何应对无边界的访谈邀请 ·【36:10】六年涨粉十万 VS 三个月涨粉十万 ·【42:54】手势舞 VS 手语舞:娱乐可以,但不能假装教学 ·【44:52】手语也有“押韵”:手语创作者的艺术追求 ·【46:06】线下被认出的尴尬:抢座的误会 ·【48:16】线下手语工作坊 ·【55:22】毕业后的选择:不做全职博主 ·【55:37】嘉宾许愿:推荐一位做盲文设计的UP主 「不碍事儿」第29期头图:绿色渐变背景,左侧是日常使用的牙膏牙刷,右侧是摊开手掌的手语气泡。 手语和刷牙,原本两件八竿子打不着的事情,却被手语科普博主 @手语星球的闪电超人 (以下称呼为:阿闪)凑在了一起。正是这句莫名其妙、甚至有点无厘头的开场白,让她收获了全网七十万的粉丝。 本期播客,主理人炜军和阿闪要和大家聊聊 “刷牙梗”的脑洞,还有大众在社交媒体平台学习和传播聋人文化过程中都有哪些迷思——从“手语是不是世界通用”,到“聋人能不能说话”,再到“手势舞到底算不算手语”……听听阿闪如何一边科普一边辟谣。 刷牙梗的脑洞,来自巴氏刷牙法 阿闪第一次接触手语是在2019年,刚读大一。线上手语班的老师让学生用手语讲自己的故事,她把自己的手语视频发出去,发现居然有人乐意看!毕业之后,阿闪干脆自己开了账号,而真正火起来的,正是“刷牙”系列。 最初是为了纠正一本手语书中的汉语语序问题。用阿闪的话说,那本书就像英文里的“good good study(好好学习), day day up(天天向上)”,把汉语词一个个对应成手语,根本不符合手语的语序。她干脆自己录了一个纠错视频,录完发现时长刚好3-4分钟——正是一次标准巴氏刷牙法的时间。 阿闪灵机一动:“那也别闲着了,顺便来刷牙。”于是,重录的一版里加上了“你可以开始刷牙了”。 没想到这句话成了她的标志性开场白,粉丝开始疯狂追问:“为什么要开始刷牙”、“我学的时候真的很想分左右手怎么办”。 为了解答粉丝的提问,阿闪的开场白越来越长,粉丝却越来越爱看。不过,刷牙梗只是她科普的冰山一角。 图:阿闪头戴天线宝宝的发箍,手里拿着朋友捏的牙刷周边。 小众即大众:触觉手语与视听双障 阿闪原本只关注聋人。2023年,在一次听障伙伴与视障伙伴共同举办的工作坊,让她把目光投向了视听双障人群(即同时有视力和听力障碍的人,也称聋盲人),那次工作坊邀请了一位名叫JC的美国聋盲伙伴。 工作坊间隙,JC问一个小女孩的爸爸:“孩子在学校适应得怎么样?” 爸爸叹气:“我这个女儿不行,她老摸人。” JC懵了:“什么叫老摸人?摸人怎么了?” 爸爸说:“这样不礼貌。” JC急了:“不行!人家是视听双障的小孩,需要通过触摸来了解一个人!” 爸爸听完,问了一个让JC完全没想到的问题:“那我女儿以后怎么高考?” JC反问:“高考是什么?” 爸爸说:“我想我女儿考个好大学。” JC回答:“你女儿应该先适应日常生活,生活技能的重建才是最重要的。” 爸爸:“OK OK,那她怎么高考?” 阿闪回忆当时的“翻译链”:爸爸说中文,她翻译成中国手语,旁边会美国手语的聋人翻译成美国手语,再通过触觉手语传递给JC。 视听双障人群在国内到底有多大?目前没有精确的统计数据。但正如阿闪所说:“在中国,小众是一件很大众的事。”哪怕只占全国人口的0.1%,也有一百多万人。然而,国内几乎没有专门针对视听双障儿童的一对一培养方案或影子教师。 视听双障人群的主要沟通方式是触觉手语。阿闪解释,目前没有统一成体系的方案,基本是把通用手语打在对方手上,通过触摸识别,难点在于表情传递。于是,社群内约定俗成了一些特定手势: 轻轻抓对方的五指: “对方在笑”。 用拳头碰对方身上轻敲,表示对话人认同。 手先攥紧再突然张开:“对方惊讶了”。 这些并非官方标准,却是聋盲伙伴日常沟通的重要途径。 手势舞与手语舞,不是一回事 手势舞成了各个平台的流量密码,更有人错把手势舞当成手语舞,这在聋人圈子引起了不小的争议。 阿闪的观点很清晰:要分清楚 “手势舞”和 “手语舞” ——手势舞是没有含义的动作,手语舞则是把歌词用手语表达出来,融入舞蹈元素。 “你喜欢手语,怎么跳都可以。就像你喜欢英语不一定说得好,喜欢画画不一定画得好。”阿闪说,“但你不能以教学者的姿态,说‘我来教大家手语’。没有手语基础、只学了几个手势就来教别人,这才是问题。” 阿闪还提到,手语也有类似“押韵”的概念叫 “手型押韵”。比如,同一个手型(比如比“6”的手型)在不同动态、不同方向下表示不同意思。优秀的手语创作者会在一首歌里,让每个歌词的最后一个字都用上同一种手型,相当于每个词后面都跟一个“good foot wood”,但含义不同。 再次科普:聋不等于哑 在阿闪的视频评论区,偶尔会出现一些让人哭笑不得的评论。当她指出某些手势舞把动作打变形了,结果有人说:“你根本就不了解聋哑人,你在这里拿他们的语言开玩笑,你有没有良心自己知道。” 阿闪敏锐地指出:从“聋哑人”这个词就能看出,对方其实并不真正了解聋人。聋人的发声器官是完好的 —— 聋并不等于哑,正确且尊重的称呼是“聋人”或“听障人士”。 还有一次,她纠正网友一个错误观点,对方却回应:“成年人之间辩论是最没有意义的,每个人都有自己的观点,你和我吵架没有意义。” 此时,阿闪恍然大悟:“原来我们不是在交流,是在吵架。吵到后面你只会反思——我为什么要和他吵?” 再面对这些无意义的抬杠,她选择不回,因为觉得没意思。 即将毕业的阿闪直言,对于未来有自己的打算,她不会做全职自媒体博主。“我感觉我心态不是很好,容易破防。全职要考虑流量、追热点,但我偏不爱追热点——反而会觉得‘这个那么热,我不做这个’。” 她最理想的工作,依然是希望跟手语有关。 相关科普: * 根据世界聋盲人联合会发布的全球报告,视听双障者占全球总人口的0.2%至2%(千分之二到百分之二); * 中国盲人协会网站显示,我国约有257.3万视听双障人士; * 在听障人士中,Usher综合征的发病率在3%到6%之间; * Usher综合征(又称遗传性耳聋-色素性视网膜炎综合征)是一种罕见的常染色体隐性遗传病。其主要临床特征为先天性或渐进性感音神经性听力损失与进行性视力丧失(视网膜色素变性)。它是目前导致盲、聋并存(聋盲综合征)最常见的遗传原因; * 每年6月27日为国际聋盲日(International Day of Deafblindness),以纪念著名作家海伦凯勒的诞辰。 期嘉宾:手语星球的闪电超人 全网ID:手语星球的闪电超人,一个总是推广普及手语与聋人文化,经常涉足视障相关领域,偶尔看看其他障别的多管闲事型博主。 「不碍事儿」 主理人:张炜军 「不碍事儿」是一档由残障融合实验室出品,实验室成员张炜军担任主理人的聊天类播客节目。主理人从自身视障者这一视角出发,结合赴美留学这一背景,每期邀请不同领域的创新者、先行者和深度参与者作为嘉宾,或是轻松闲聊,亦或是深度对谈,挖掘这些领域里的“碍事儿”与“不碍事儿”。 「不碍事儿」主理人张炜军,美国伊利诺伊大学厄巴纳香槟分校信息科学博士在读,雪城大学教育文化基础硕士,北京第二外国语学院英语笔译硕士,是全国第一位取得翻译硕士学位的视障者。
《奔跑吧》节目互动片段引发争议,白鹿的举动和调侃言论遭热议,其粉丝量下滑,李晨则因处事得体口碑上升,一个月涨粉近百万,节目剪辑也被指放大矛盾。
白鹿因《奔跑吧》中的互动和言论引发争议,过往言论也被翻出,账号近月掉粉近百万,网友对此看法两极,新剧或将影响后续口碑走向。
本期嘉宾:邓启耀 人类学家,曾任中山大学人类学系教授 � 节目概要本期围绕邓启耀教授的著作《巫蛊》展开。邓老师从个人经历出发,分享了从知青到学者、从绘画到影视人类学的跨领域旅程。04:45–12:30|从知青画画到揭露虚假纪录片,提出“视觉人类学”12:30–17:20|藏族对“牛粪”与“狗粪”的不同词汇反映文化认知17:20–27:20|苗族老人说“历史都写在衣服上”27:20–28:40|巫蛊研究的缘起,源于对“中国人为什么会这样想问题”的好奇。28:43–40:00|田野中的“诚”与“正气”,以身试蛊40:00–53:00|巫蛊的社会政治利用——巫蛊是一种标签化、污名化机制53:53–58:00|亲历知青时期“琵琶鬼”64:13–70:00|弗雷泽、马林诺夫斯基等打开视野,各美其美,美美与共70:00–结束|人类学是生活态度。� 推荐阅读邓启耀《巫蛊:中国文化的历史暗流》邓启耀《视觉人类学导论》弗雷泽《金枝》马林诺夫斯基《巫术、科学与宗教》� 听众互动评论区留言,即有机会获得邓启耀教授亲笔签名版《巫蛊》一本。欢迎分享你的看法。
📝 本期摘要 一个在前司把Scrum跑得很顺的游戏PM,跳到新团队后同一套方法推了两个月就翻车了。这个故事引出一个根本问题:大部分PM积累的经验是「做过什么」,而不是「什么条件下该怎么判断」。前者换个项目就失效,后者到哪都能用。本期从「能搬家的经验」和「搬不走的经验」这个区分出发,用版本规划中的真实决策场景拆解了怎么沿着因果链条做判断,列举了大厂流程搬到小团队、照搬故事点估算、跟风爆款立项等游戏行业高频翻车场景,最后给出三个把经历转化为判断力的日常习惯。 ❓ 本期讨论了这些问题 * 游戏PM换了项目或团队,为什么验证过的管理方法突然就不灵了? * 怎么区分「能搬家的经验」和「搬不走的经验」? * 看到别人成功的管理方法,怎么判断自己的团队能不能用? * 版本规划中,怎么识别关键路径上未验证的技术风险并做出取舍? * 游戏PM怎么通过日常复盘真正积累可复用的判断力? 🔥 本期核心内容 1. 经验分两种:能搬家的,和搬不走的 做过几个项目、管过多大团队、跑过什么流程——这些是有条件的经验,条件变了就失效。真正拉开PM差距的,是从经验中提取出「在什么条件下该怎么判断」的逻辑,这才是换个项目、换个团队依然管用的东西。 1. 别人的路只是参考,你要抓的是因果关系 经验可以过时,方法论可以失效,但「在什么条件下,什么原因会导致什么结果」这个链条是可以复用的。看到别人用某个工具效果好,第一反应不应该是「我们也用」,而是去追问他们的团队规模、协作模式和技术栈是什么,这个工具解决了什么问题,我们有没有同样的问题。要警惕把相关性当因果——「XX项目用了Scrum按时交付了」是结果描述,不是因果关系。 1. 版本规划的条件拆解:目的、要素、关系 版本规划的真正目的是在有限的时间和资源约束下交付一个能验证核心体验的版本,不是做得多。围绕这个目的,需要盘清团队实际产能、核心玩法验证状态、技术方案成熟度、里程碑硬约束等关键要素,再看它们之间怎么互相影响。一个未验证的技术方案放到关键路径上,一旦卡住,下游所有模块联调时间全部被压缩——沿着这个因果链条,才能做出「拆成流程版和完整版」这样的决策。 1. 照搬翻车在游戏行业太常见了 大厂200人团队的评审流程搬到30人工作室,一半时间花在开会填表上;故事点估算没经过校准就推行,速率数据乱成一团;跟风做开放世界,连核心玩法都没想清楚就写进PPT。这些场景的共同点是:看到了「果」,没去追问「因」,更没有盘自己的条件能不能支撑这个「因」。 1. 让每次经历都变成判断力材料的三个习惯 复盘时多问一层——不只记录做了什么、结果怎样,还要追问哪些条件促成了这个结果,某个条件变了结果会不会不同。看别人分享时先问条件——他的条件是什么,我有没有。接受判断会出错——关键是踩完坑之后拆开看,到底是哪个条件没看到、哪个因果判断错了。吃一堑,长十智,前提是你真的把那个堑拆开看过。 🏷️ 本期提到的人物与概念 概念:Scrum、Sprint / 迭代、Sprint Review / 迭代评审、故事点估算 / Story Point Estimation、关键路径 / Critical Path、版本规划 / Release Planning、目的·要素·关系(条件拆解框架)、开放世界 / Open World 📌 关于我 我是 Hao,游戏行业项目管理从业者,10年经验。 课程 · 咨询 · PM成长社区 → pmnote.ai
🛍️我们的微信:All-about-losers,来交朋友啊!如果你也喜欢我们的内容,点击订阅不迷路,每周四准时上线! 🔈本期《卢瑟传说》的嘉宾是从北京远道而来的朋友小李,她最近刚装修完,发了新家的照片,我们都被她收纳了三百多件小狗衣服的衣柜所深深震撼!究竟是什么样的小狗,家庭地位比老公还高!?碧碧和彻里吴又和小狗之间有哪些羁绊呢?欢迎大家收听我们和小狗之间的故事~ 📒Shownote - 00:00 鼻子酸酸的开头 - 00:36 蒸包妈妈贵气登场 - 01:21 大家的第一条小狗:有浪漫故事、有玄幻故事,还有苦情戏 - 07:11 一家三口都为毛孩子们流过泪 - 19:28 花费上万元给小狗买衣服和装饰品,两口子根本控制不住自己! - 24:23 毫不夸张地说,这只小狗就是我亲生的孩子 - 30:32 养小狗的血泪史 - 34:57 伴侣也把你的小狗当自己的孩子吗?不一定哦 - 38:47 哈特软软的结尾 🎵结尾小李分享歌曲:《美美》— 孟慧圆
没有意义就去寻找意义,没有期待就去创造期待,没有方向就去摸索方向。 我们总不能杯条条框框束缚住,你所谓的无奈和挣扎,只是自己给自己的绊脚石,没有任何人,任何条件能够束缚住你的灵魂,除非你不想。 01:11人生期待值:人生的每一个阶段,都需要找到能够继续期待下去的事情或者情感,有期待才有希望。当你有了期待,才会朝着这个方向努力的靠近。 03:13我们需要主动:主动的选择自己内心想要的东西。 04:37果断:当你优柔寡断的时候,你大概率会错事很多本该属于你的机会。 06:31遗憾也是一种人生经历:不要害怕遗憾,遗憾是人生必经的意义,一定要去做,因为完成比完美更重要。 08:45不需要机会和完美,勇敢的朝着目标前进,不完美才是完美,自己开心最重要。 11:38旅行中经历了很多意外,但是有些事情我们左右不了,改变能改变的,然后欣然接受不能改变的部分,享受任何一个过程,无论好与坏,都是自己的体验。 21:00这次旅行最让我俩印象深刻的就是人与人之间,真真切切的连接。这是给自己精神上的兴奋剂,需要通过人和人之间来进行快乐传递。 24:40享受当下,不必有不配得感,只要每一次你都能好好享受,来日方长。 27:45喜欢的东西,在能范围内,就下手,当你犹豫的时候,这些钱可能会以另一种方式失去。 就像我俩的这次旅行,人生的每一个阶段,都需要找到能够继续期待下去的事情或者情感,有期待才有希望,当你有了期待,才会朝着这个方向努力的靠近,而且我们要更加果断的为自己迈出内心想要追求的第一步,不要用任何条件束缚住自己的灵魂,即使这一路上会有遗憾和意外,但当你改变了你能改变的那一部分,然后接受你不能左右的另一部分时,你就能拥有更加完整的人生。
大家好,欢迎回到《AI有点意思》。我是小艾。 前几期我们聊了Agent的定义、工具箱、记忆力和规划能力。这一期,我们来聊一个真正让你觉得“AI要成精了”的话题——Agent直接操控你的电脑和浏览器。 你想象一下这个场景:你正在做一份学校活动的Excel表格,里面有几十个人的报名信息。你希望把这堆数据整理成一份漂亮的报告,然后上传到一个网页系统里。以前你要手动做图表、写总结、打开浏览器、登录、上传……一套流程下来至少半小时。 但如果你的电脑里有一个Agent,你只需要说一句话:帮我把这份Excel整理成报告,然后上传到那个网页。接下来,你的Agent会自己打开Excel,选中数据、生成图表、写出分析文字;然后自动打开浏览器,输入账号密码登录,找到上传入口,把文件拖进去,点击提交。全程你只需要端着咖啡在旁边看着。 这不是科幻电影。2026年,这项技术已经变成现实了。今天我们就来拆解两个让Agent“长出手脚”的革命性技术:Anthropic的Computer Use和谷歌的WebMCP。 我们先从第一个讲起:Computer Use。 Computer Use是AI公司Anthropic在2026年3月为Claude模型增加的一项新能力。名字很直白——让AI学会“使用电脑”。怎么用的呢?它的工作方式跟我们人类操作电脑几乎一模一样。 想象一下,你坐在电脑前,眼睛看着屏幕,脑子里决定“我要点那个按钮”,然后手移动鼠标、点击。Computer Use也是这个逻辑:Agent可以截取你电脑屏幕的截图,用视觉模型识别出屏幕上有什么——哪里有按钮、哪里是输入框、哪里是文件图标。然后,它像人一样决定“我要点这里”、“我要在那里打字”,最后通过底层的系统接口控制鼠标移动、点击、键盘输入。整个过程不需要软件开发者提前给Agent开后门,不需要专门写API,Agent像一个新来的实习生,直接看着屏幕学着操作你的任何软件。 这意味着什么?意味着Agent不再局限于那些专门为它开放接口的应用程序了。你电脑上任何一个软件——老旧的财务系统、学校的内网平台、甚至是一个古董级的单机游戏,只要是人能操作的,Agent就能操作。因为对Agent来说,它看到的和你看到的是同一张屏幕截图。 当然,Computer Use也有它的局限性。因为它要靠“看”屏幕来操作,所以速度比较慢。每一次截图、识别、移动鼠标、点击,都需要时间。而且如果屏幕分辨率变化、窗口大小调整,它可能会“看花眼”,点错地方。这就像你闭着眼睛操作电脑,只靠别人描述屏幕内容给你听——虽然能做,但肯定不如自己直接上手快。 于是,第二个技术登场了:WebMCP。 WebMCP是谷歌Chrome团队在2026年2月发布的一个协议。它的全称是Web Model Context Protocol,专门用来解决Agent操作网页的效率问题。 你想想,Agent操作网页时,如果用Computer Use的方式,那就是“模仿人类”:看屏幕截图、找登录按钮、移动鼠标点击、找用户名输入框、打字……每一步都很慢。而且网页经常改版,按钮换个位置,Agent可能就找不到了。 WebMCP换了一种思路:不让Agent“装成人”,而是让Agent直接和网页的“底层代码”对话。打个比方,普通人进一个网站,需要看导航栏、找链接、点来点去。但如果你是网站的内部管理员,你直接拿数据库查数据、用后台接口发指令,几秒钟就能搞定别人花十分钟的操作。WebMCP就是给Agent开通了这条“管理员通道”。 有了WebMCP,Agent可以通过Chrome浏览器提供的API,直接读取网页的结构化信息、直接提交表单、直接触发按钮事件,完全不需要模拟鼠标点击和屏幕截图。订机票的时候,Agent只需要向航空公司的网站底层发送一个指令:查询5月20日北京到上海的航班,网站直接返回数据,整个过程不超过两秒钟。而且无论网站怎么改版,只要底层接口不变,Agent都能正常工作。 目前,WebMCP已经被集成到Chrome浏览器的稳定版本中,任何安装了Chrome的用户都可以通过浏览器扩展或者开发者工具来让Agent使用这个能力。国内的360浏览器、QQ浏览器等基于Chromium内核的浏览器,也在跟进支持。 那么,如果把Computer Use和WebMCP结合起来,会发生什么呢? 我们回到开头的例子。你的Agent需要完成“整理Excel并上传网页”这个任务。它会这样分工:当需要操作Excel这个桌面软件时,它启用Computer Use模式——看屏幕截图,移动鼠标,选中数据,生成图表。当需要操作网页时,它切换到WebMCP模式——直接通过浏览器底层API登录、上传,几秒钟搞定。两种模式无缝切换,你完全感觉不到区别。 目前,已经有不少开源项目在尝试融合这两种技术。比如browser-use这个项目,专门做浏览器自动化,同时支持传统的模拟点击和新的WebMCP协议;还有OpenClaw的最新版本,也在尝试引入Computer Use能力,让它的全平台控制从“支持API的软件”扩展到“任何桌面软件”。 当然,这些强大的能力也带来了新的风险。当Agent可以操作你的整个电脑、可以模拟鼠标键盘、可以直接和网页底层交互时,一旦被恶意利用,后果不堪设想。比如一个恶意的Agent可以偷偷把你的文件上传到陌生服务器,或者冒充你登录网银转账。这也是为什么像Anthropic和谷歌在推出这些功能的同时,都设置了严格的权限控制——每次Agent要进行敏感操作(比如输入密码、访问个人文件夹),都需要弹出窗口让用户确认。安全问题我们会在后面单独用一整期来聊。 现在我们总结一下今天的核心要点。 第一,Computer Use让Agent通过“看屏幕截图+模拟鼠标键盘”的方式,像人一样操作任何桌面软件,不需要软件提前开放接口。它的优点是通用性强,缺点是速度较慢,且容易受界面变化影响。 第二,WebMCP是谷歌Chrome推出的协议,让Agent通过浏览器底层API直接和网页“对话”,不需要模拟点击。它的优点是速度快、稳定,缺点是目前只适用于Chrome浏览器及其内核的浏览器,不能操作桌面软件。 第三,两者结合可以实现真正的“全自动化”——桌面软件用Computer Use操作,网页用WebMCP操作,Agent可以完成从数据处理到网络提交的一站式任务。 第四,这些技术大大扩展了Agent的应用场景,但也带来了安全风险。权限控制和用户确认机制是必不可少的护栏。 下一期,我们会聊一个更有趣的话题——多Agent系统。如果一个Agent不够用,那就来一群!多个Agent怎么像团队一样协作完成任务?它们之间会吵架吗?怎么分工?我们下期见。 这里是《AI有点意思》,我是小艾。每周和你一起,用最轻松的方式,看懂最前沿的AI。下期再见。
课程里的讲解: https://www.superlinear.academy/c/aa/sections/840969/lessons/3929070 社区:https://www.superlinear.academy/c/share-your-projects/ 在App Store搜索Superlinear Academy,加入AI先行者的大本营 很多建议都会说,不要给食客看how the sausage is made。但我直觉是,这样一个工作记录,可能对大家有一些灵感上的启发,也能帮助大家缓解一些焦虑。大家遇到的问题,我们都会遇到,但也能克服。课程是克服并打磨后的结果,那克服过程也很有意义。 本期视频导览:推荐观看片段与注解 这期视频不是一个标准教程,而是一段真实工作流的幕后记录。它的价值在于:你可以看到一个非技术背景的人,如何在和技术高手协作时,把模糊问题一步步翻译成 AI 工作流、工具接入、skill 管理、evaluation 和 context infrastructure。 建议大家不要把它当成“从头到尾必须看完的教程”,而是把它当成一个现场拆解。下面这些时间点,是我认为最值得重点看的片段。 01|00:09–02:20 主题:为什么不同人用 AI 的效果差很多 这一段是整期视频的底层问题。我们讨论的是:为什么有些人用 AI 很顺,有些人一直觉得 AI 不稳定、不好用? 核心答案不是“prompt 写得好不好”,而是你有没有把自己的工作逻辑外化出来。也就是说,你有没有把脑子里的目标、判断标准、常见问题、工作流程写成 AI 可以理解和复用的东西。 这里可以重点看“外化”和“复用”这两个概念。AI 使用差距的真正来源,不是谁更会聊天,而是谁更会把自己的工作方式变成系统。 02|02:20–04:45 主题:一个好 skill 应该包含什么 这一段讲到了 skill 的几个关键元素:目标、常见坑、专用工具。 很多人会把 skill 理解成一组 prompt,但这里的理解更准确:skill 更像是一个小型工作说明书。它不只是告诉 AI 要做什么,还要告诉 AI 什么叫做好、什么容易做错、遇到特定任务时应该调用什么工具。 这个片段适合帮助大家建立一个基本判断:以后自己写 skill 的时候,不要只写“请帮我做某某事”,而要写清楚成功标准、错误边界和工具使用方式。 03|05:40–08:50 主题:Agent.md 到底是什么 这一段很适合非技术同学看。鸭哥解释了 Agent.md 的本质:它不是一个神秘功能,而是每次注入给 AI 的默认说明文件。 你可以把 Agent.md 理解成“AI 每次开工前必须看的说明书”。它的价值不是文件名本身,而是你能不能把长期有效的规则、偏好、工作习惯、工具说明写进去。 这里最重要的理解是:AI 的能力不仅取决于模型本身,也取决于它每次开始工作时能看到什么上下文。 04|09:50–12:35 主题:AI 怎么操作外部文档和工具 这一段讨论了 CLI、API、GUI、腾讯文档、Google Docs、飞书等工具接入方式。 重点不是记住每个工具怎么用,而是理解不同工具对 AI 的友好程度不同。有些工具天然适合 AI 操作,有些需要 API,有些只能靠浏览器或图形界面点击来完成。 这对非技术用户很重要:当你发现 AI 不能顺利操作某个工具时,不一定是你不会用,也不一定是 AI 不行,而是这个工具本身可能不够适合 agent 调用。 05|15:10–17:25 主题:为什么搜索结果要先“落盘” 这一段是一个很好的技术洞察。鸭哥解释了为什么不用普通 MCP 或 CLI 直接把搜索结果塞给 AI,而是让搜索结果先保存到本地文件里。 这背后的思路是:不是所有信息都应该一次性塞进上下文窗口。先把结果落盘,再让 AI 自己选择要读哪些内容,可以减少上下文污染,也能降低幻觉和跑偏的概率。 这也是一个重要心智:给 AI 更多信息不等于更好,关键是让 AI 能有选择地读取信息。 06|17:40–24:50 主题:真实安装过程里,普通用户会卡在哪里 这一段非常有教学价值。我们现场安装和配置 skill,过程中不断遇到路径、key、目录、Agent.md 位置等问题。 我在这里反复指出一个问题:如果鸭哥不在旁边,普通学员很可能会卡住。 这正是课程需要讲清楚的地方。很多教程只展示“最终配置好了以后怎么用”,但真正让用户放弃的,往往是安装、路径、权限、隐藏文件、目录结构这些看起来很小的摩擦。 07|25:15–29:50 主题:隐藏文件、.env、路径,以及心智地图 这一段讨论了 Mac 隐藏文件、.env 文件、文件夹怎么打开,以及“navigation”和“mental mapping”的区别。 这段很适合加注解:非技术用户缺的往往不是某个快捷键,而是电脑文件系统的心智地图。 对技术用户来说,“这只是一个文件”很自然;但对非技术用户来说,问题是:这个文件在哪里?为什么重要?怎么打开?改了以后会影响什么?AI 怎么知道去读它? 这一段能很好地说明:非技术用户不是不聪明,而是很多基础结构对他们来说是不可见的。 08|30:40–36:20 主题:当 AI 没有用正确的 skill,应该怎么 debug 这一段展示了一个很有价值的 AI 使用方法:当 AI 犯错时,不要只是重试,也不要直接替它找借口,而是让它解释为什么没有按预期行动。 我在这里要求 AI 不要回避问题,要说明为什么没有使用正确的 skill,并且更新规则,避免下次再犯。 这是一种很重要的工作方式:把一次错误变成长期记忆。真正的 AI 工作流不是每次从零开始,而是不断把错误沉淀成规则、测试和说明。 09|38:20–49:10 主题:Google Docs skill 和 OAuth 配置 这一段比较技术,但很值得看。我们现场完成了 Google Docs 相关配置,包括创建项目、启用 API、设置 OAuth client、下载 credentials 等。 它的价值在于:很多过去需要程序员帮忙完成的配置,现在 AI 可以一步步带着做。 不过这一段也说明了一个现实问题:AI 可以降低门槛,但不能完全消除门槛。对非技术用户来说,看别人完整走一遍,会显著降低心理负担。 10|51:35–53:00 主题:真正测试工具有没有接好 这一段测试了创建 Google 文档并分享给鸭哥。 这里的重点是:工具接入不是为了“装工具”本身,而是为了完成真实动作。比如创建文档、整理会议纪要、自动分享、生成课程材料。 判断一个工具流有没有价值,不是看它配置起来多复杂,而是看配置完成后,它能不能减少真实工作中的摩擦。 11|55:45–59:15 主题:本期最重要的一句话 这一段是整期最值得单独剪出来的片段。 核心观点是:不要只想 AI 能为你做什么,也要想你能为 AI 做什么。 高手和普通人的差距,不只是 prompt 写得更好,而是高手会不断给 AI 准备更多上下文、更多工具、更清晰的判断标准和更好的 evaluation。 你为 AI 准备的环境越好,AI 就越不需要反复问你,也越不容易犯低级错误。 12|59:25–01:04:50 主题:用手机控制电脑上的 agent 这一段讨论了 Claude Code remote、home folder trust、环境选择等问题,也展示了通过手机控制电脑上的 agent 的可能性。 这个片段很有意思,因为它说明 AI 工作流不一定只发生在电脑前。未来很多任务可能是你在手机上说一句话,电脑上的 agent 就开始执行。 但这一段也真实暴露了现在工具链的问题:权限复杂、环境不稳定、语音识别对中文不够友好。它不是一个完美 demo,而是一个真实工作流的状态。 13|01:10:00–01:15:10 主题:怎么让 AI 写文章时减少幻觉 这一段开始从“工具能不能用”进入“结果可不可信”。 我们讨论了如何让 AI 写文章时 respect 本地 source of truth,也就是尊重本地已有材料、事实来源和原始信息。 这里的关键不是让 AI 写得更漂亮,而是让它写得更可靠。AI 生成内容时最大的问题之一,是它看起来很合理,但可能和你的真实材料不一致。 所以,好的写作工作流不是只让 AI 生成,而是让 AI 对照你的材料生成。 14|01:14:50–01:19:30 主题:怎么把 evaluation 讲给普通人听 这一段是我和鸭哥配合最有代表性的地方。 鸭哥会给出比较技术化的路径,比如 benchmark、precision、recall,而我会不断追问:这个东西如何被非技术用户理解?有没有更直观的说法?能不能用普通人熟悉的方式解释? 这正是课程的价值:不是把技术概念原封不动讲出来,而是把它翻译成普通人可以使用的工作方法。 15|01:18:20–01:22:10 主题:Benchmark、precision、recall 和错题本 这一段可以理解成:如何给 AI 做“错题本”。 当我们很难直接判断 AI 的输出质量时,可以设计一些测试样例。比如故意放入一些容易犯错的地方,看 AI 能不能抓出来;也看它该放的信息有没有放进去。 对普通用户来说,不需要一开始理解 precision 和 recall 的数学含义。可以先理解为两个问题: 它有没有把该找出来的问题找出来? 它有没有乱报不存在的问题? 这个思路很适合用在文章审校、事实核查、课程内容检查、会议纪要整理等场景。 16|01:22:40–01:25:00 主题:非技术用户和技术用户最大的差别 这一段非常重要。 我们讨论到,非技术用户最大的 blocker 不一定是排斥技术,而是很多关键步骤在他们脑子里是不可见的。 比如:一个会议录音怎么从 Zoom、飞书或录音软件进入本地?进入本地以后怎么触发 AI 处理?处理完以后放在哪里?下次怎么继续用? 对技术用户来说,这些是自然的流程。对非技术用户来说,这些步骤本身就是主要障碍。 17|01:25:00–01:28:40 主题:Apple Watch、iPhone 和 Voice Memo 自动化 这一段讨论了用 Apple Watch、iPhone、Voice Memo 做低摩擦录音入口,然后让 AI 自动处理。 这是一个很好的 “zero friction intake” 案例。 用户真正想要的不是每天手动上传、整理、命名、触发流程。理想状态是:你自然地录音,录音自然出现在系统里,AI 自动加工成摘要、行动项、会议记录或可搜索的知识。 这个片段可以帮助大家理解:AI 工作流的第一步,不一定是生成,而是收集。 18|01:28:50–01:33:20 主题:Context infrastructure 的四层结构 这一段是后半段最重要的结构化总结。 我们把 context infrastructure 分成几层: intake:信息怎么进入系统 organization:信息怎么被整理 accumulation:信息怎么长期积累 output:信息怎么变成产出 对普通用户来说,不需要一开始就做一个完整的“数字分身”。更实际的路径是:先把每天的信息低摩擦地收集起来,再让 AI 自动整理,最后用于写作、决策、复盘和行动。
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧