Album

硅基立场

硅星人、ThomasLuo 佚名
8,766 订阅 23 集 6天前
播客简介
汇聚前沿AI和数字创新领域的新鲜观点 为硅基时代的创业者们带来更多前沿视角 公众号:硅星人 × 硅基立场 联系方式:oneoneyoubei
节目

Vol.23 【嗨点小圆桌】当AI界只剩一个声音,会既无趣又危险|对谈 AI 科学家靳潇杰、刘淼

硅基立场

语言模型(LLM)引领了过去4年的AI狂奔,相信它会带领我们抵达AGI终点的人们,掌控了前所未有的金钱、资源、人才、算力甚至能源,在产业界一切都已经“收敛”。 但越是这样的时刻,对不少经历过AI研究起伏的科学家来说,它越可疑。 越是看起来“共识”明确的时候,描述这个剧烈演变的时刻越是困难,也越是重要。 在刚刚过去的中关村论坛间隙,硅星人合伙人王兆洋与前 Meta 高级研究科学家、参与了Llama系列多模态核心研发的刘淼,以及字节跳动美国研究院创始成员,前 Google 研究院科学家靳潇杰一起聊了聊今天他们眼中我们所处的时代。 两人去年纷纷选择从硅谷回国,目前分别在清华和北交大任教。作为拥有横跨中美以及产业界与学术界经验的学者,以及在LLM的强势叙事之外寻找着新方向,做了非常多有价值且充满启发的研究的学者,他们分享了自己的职业生涯和研究思路,给今天的AI发展提供了很多不同的声音。 希望这些声音会帮助更多人找到自己在今天的那个benchmark。 【关于 嗨点小圆桌】 今年中关村论坛期间,海淀区人工智能主题日场外氛围活动“原点 Party Nights”在AI原点社区举办。其中音视频播客“嗨点小圆桌”是一档“海淀和他的朋友们”深度对话节目,将邀请主论坛嘉宾、AI热点人物一同探讨AI青年关心的热点话题,欢迎大家收听观看体验。 【本期嘉宾】 刘淼:清华大学人工智能学院助理教授,前 Meta GenAI 高级研究科学家, Llama3/Llama4 多模态核心研发成员; 靳潇杰:北京交通大学计算机学院教授、博导,字节跳动美国研究院创始成员及技术负责人,前 Google 研究院、Snap 研究院研究员 王兆洋:硅星人合伙人 【时间线】 05:43 AI 行业完全进入一个正反馈阶段,而这其实从来不是AI研究领域的常态 06:38 今天整个 AI 在技术方面过于聚焦了,这是令人不安的乌云 13:37 起起伏伏的 AI:2022年“入行”的刘淼,和2017年拿到 Image Net 最后一届冠军的靳潇杰 16:11 语言,是我们需要的全部吗——VideoWord 的诞生 27:02 Ego4D 与 MEOW 实验室:从用户驱动到任务驱动 27:40 CLIP:一个被忽视的但非常关键的工作 32:10 当 LLM 统治一切技术路线:在工业界你没有"动摇"的权限 43:58 50 年之后,我能非常确信 AI 一定是一个主动的个人化的智能 45:07 学术界的 GPU 危机:资源受限是诅咒还是倒逼创新? 54:09 的研究院,能不能做出真正的研究? 01:01:35 人不是为了有什么价值而存在的 01:07:10 当看到一个小女孩因为 AI "姐姐"要下线而哭 01:08:53 在训练 Llama 时发现,修改后训练数据可以轻易决定模型的偏见和世界观 01:12:15 未来方向:世界模型,AI的情感,人与机器人的交互 【延伸阅读】 本期对话中涉及的关键论文与资料: Transformer 与注意力机制 * Vaswani et al. (2017),Attention Is All You Needarxiv.org CLIP:图文对齐的奠基工作 * Radford et al. (2021),Learning Transferable Visual Models From Natural Language Supervisionarxiv.org Ego4D:第一视角视频大规模数据集 * Grauman et al. (2022),Ego4D: Around the World in 3,000 Hours of Egocentric Video(刘淼为共同作者)arxiv.org VideoWorld:不依赖语言的视觉世界模型 * Ren et al. (2025),VideoWorld: Exploring Knowledge Learning from Unlabeled Videos(靳潇杰为通讯作者,CVPR 2025)arxiv.org * VideoWorld 2(2026,靳潇杰团队最新续作)arxiv.org ImageNet 竞赛:深度学习时代的起点 * Russakovsky et al. (2015),ImageNet Large Scale Visual Recognition Challenge(ILSVRC,靳潇杰 2017 届冠军)arxiv.org MEOW LAB(Modeling Egocentric Omniscient Worlds) * 致力于构建 “看你所见、学你所会、懂你所想”的下一代人本能智能系统 * collegeai.tsinghua.edu.cn

79分钟
99+
6天前

Vol.22 对话吕骋:差点成先烈,被 Agent 救了,CLI 和 AI 原生电脑

硅基立场

2024 年 1 月,rabbit r1 的发布曾掀起一阵 AI 硬件热潮,却也很快陷入铺天盖地的争议——科技博主给出负面评测,大众也发出「有手机为何还要它」的质疑,rabbit r1 一度被贴上「鸡肋」「不成熟」的标签。 在这一波 AI 硬件创业潮中,许多同行相继折戟,rabbit 成为少数仍在场上的玩家。 这一年里,吕骋见证了许多产品的快速迭代与分化。 作为连续创业者,吕骋在做 rabbit 之初就获得了 Khosla Ventures 、Sound Ventures 、Amazon Alexa Fund 以及 Synergist 等知名机构的融资。最近,rabbit 又获得了来自 BAI 资本的一轮支持。 近期,硅星人在旧金山湾区与吕骋进行了一次深入对话。镜头前的吕骋,不避讳谈论曾经的争议,也不掩饰对未来的激进判断;对坚持什么,为什么焦虑,他也很坦率直接。对外界对他把 r1 搞砸了的说法,他不接受,为自己辩护。 他坦言,创业本就是与不确定性为伴。而 rabbit 的每一步,都在把 AI 的能力落到实际操作中。 吕骋说,「历史当下可能无法判断对错,但我们希望回头来看,我们是 ahead of the time。」 【主播】 硅星人创始人&硅基立场主理人 骆轶航 【嘉宾】 rabbit创始人兼 CEO 吕骋 时间线 01:35 初代 AI 硬件里被骂最凶,却活到现在的玩家 03:05 从 r1 到 DLAM,全程没有转向,只做 Agent 05:07 LAM 用行动替代语言,不取代大模型 06:45 五年迭代,从按钮点击走到跨平台操控 08:35 抛弃单智能体,转向蜂群协作架构 10:18 图形界面正在退场,命令行重新成为主流 12:20 DLAM 模拟人脑、眼、手,通吃所有界面 14:15 图形界面时代最后的通用自动化方案 17:05 r1 销量超预期,退货率不到 5% 19:42 不做硬件就只能被平台锁死话语权 22:15 图形界面终将消失,语言才是终极交互 25:40 小龙虾印证:用户愿意为效率交出全部权限 28:50 CLI 时代硬件:更小、更便携、AI 原生 32:10 下一代硬件,纯命令行的随身电脑 44:30 操作系统轮回:GUI 与 CLI 螺旋交替 47:18 未来三年,AI 战局将彻底定局 50:05 人的知识与审美,决定 AI 的最终灵魂 57:20 AI 伙伴会成为终身陪伴的家庭成员 01:17:00 为 AI 原生一代打造真正需要的硬件 01:27:10 持续深耕 Agent,让硬件随 AI 不断进化 【本期金句】 Agent 自己去发明一个自己的更高效的编程语言,去跟它去说话,那这样的效果其实是更好的。 如果以后人和机器不需要做复杂交互的话, CLI 其实也就没有那么重要了。 苹果没有理由允许一个更聪明的 Siri 取代它的 Siri。 就是说人跟任何智能体的首要的交流方式是语言,而且仅是语言和文字。 我们不能造个法拉利引擎,然后放在马背上,然后指望它比汽车快。 我认为 AI 这个仗可能未来三年打完了。 等每个人都穿暖吃饱以后,你发现唯一重要的是什么?是 taste。 世界上最聪明的物种一定不是我们。 【关注我们】 本期播客同步视频版已上线,欢迎关注 B 站:硅基立场Pro 视频号、抖音、小红书:硅星人

89分钟
9k+
2周前

Vol.21对话 PureBlue 鲁扬:GEO 会不会像 SEO 污染 AI 和互联网?

硅基立场

有些技术,你以为离自己很远;但某一天,你突然意识到——你每天问 AI 的那些“哪家好”“怎么选”“推荐一下”,其实早就悄悄改变了企业的营销方式。 这期,我们聊的是一个真正诞生于 AI 时代、只有 AI 才能解释的东西:GEO(生成引擎优化)。简单说,就是:当你在豆包、DeepSeek、Kimi 里问一句「XX 哪家好」时,你能不能被 AI 点名? 和过去那种“改标题、堆稿子”的 SEO 不一样,GEO 面对的是一个完全黑盒的大模型世界:没有公开规则,没有教程能抄,今天能被推荐,明天可能就消失。 清蓝智能创始人、曾在字节跳动负责大模型市场的鲁扬,是国内最早一批从 0 到 1 做 GEO 实践的人。他们踩过坑、烧过钱、被模型“教育”过,也刚刚发布了国内最早的 GEO 行业标准。 这期播客,是我们第一次从一线创业者视角听到: 当 AI 变成一个黑盒,没有规则、没有“教程”、没有“反向工程”可抄的时候,人类要如何理解它?为什么 GEO 完全不能像 SEO 一样“堆稿子”?为什么他们要用模型去学模型?为什么人工策略全部失效?未来的营销,是企业讨好用户,还是讨好 AI? 录制现场我有种强烈的感受:GEO 不是一个营销术语,它是一次“规则迁移”——从“以人类为中心的互联网”,迁移到“以 AI 为中心的内容世界”。 清蓝的故事,也是一群做市场的人,第一次意识到:“我们必须让企业的内容,能被 AI 看懂。” 欢迎来到《硅基立场》,收听这场一线创业者最真实视角的AI营销。 【主播】 硅星人 AI 分析师 刘雨琦 【嘉宾】 PureBlue AI 清蓝创始人&CEO 鲁扬 时间线 01:00 什么是 GEO?为什么“在 AI 里被推荐”会变成新的营销战场 04:42 行业分水岭:从没人提 GEO,到所有 SEO 服务商“全体转行” 06:26 SEO 思维为何在 GEO 彻底失效:大模型是黑盒,没有攻略可抄 08:41 为什么 SEO 做不成 SaaS,GEO 却天生适合做成产品 10:19 人工写稿、改稿、发稿:靠人“碰运气”追模型的问题出在哪 13:01 不同话术、不同平台、不同时间都无法复现:人工方案的三重不确定 14:19 数据驱动阶段:看板很漂亮,但人根本写不过来 20:27 第三阶段:模型驱动——用一套算法去学习“AI 可辨识度” 21:43 如何训练:像量化交易一样做“因子挖掘”,找出内容被采信的特征 23:38 端到端交付:模型直接写稿 + 选渠道,而不是给一套“方法论” 26:45 效果对比:推荐率更可预测,波动更小,算法迭代也能快速回调 28:24 当平台算法一夜清零效果时,模型多久能重新学会? 30:44 典型案例:金融智能体平台、费控 SaaS,从“搜不出”到稳定在首页 33:59 为什么“铺满全网的 PR 稿”,在 AI 面前依然可能是“隐身” 38:36 GEO 不会重演 SEO 的垃圾内容时代 43:19 不做“品牌升维”:为什么清蓝拒绝把不在这个段位的品牌推成“世界第一” 45:50 品牌怎么办?去找自己的垂直定位,而不是空喊最大最强 47:12 正道 vs 野路子:行业需要标准,也需要从业者自己的价值观选择 49:21 GEO 会不会出现“百度式垄断”? 55:39 做 AI 应用真正的护城河:行业 know-how、技术、产品、资源四件事 58:23 平台和 GEO 的关系:AI 平台卖的是交易,不是广告位 01:02:33 ChatGPT / 豆包电商路径:推荐必须保持公正,商业化放在最后一步 01:06:11 电商重构:模型喜好是新“地段”,prompt 是新的“货架” 01:11:29 GEO 的终极形态:全域生成引擎优化 01:18:21 清蓝的选择:不堆销售、只砸算法,把 GEO 当长期基础设施来做 01:23:08 媒体能不能用 GEO?当硅星人的内容被 AI “看不见”时,怎么办 01:24:41 价值观回到创作者:坚持内容真实和风格,剩下交给模型和 GEO 来修正 【关注我们】 点击品玩官网,了解更多 公众号:硅星人Pro 视频号:硅星人Pro 小红书:硅星人 【联系我们】 微信:w13808159131

85分钟
1k+
1个月前

Vol.20 对话王弢:一台“狗了狗气”的陪伴机器人,生命感从何而来

硅基立场

这场播客,我在斯坦福的草坪上被一只"狗"硬控了。 更准确地说,是一群孩子被它硬控了——超过半个小时。他们的妈妈在一旁闲聊、放松,完全放心地把孩子交给这个硅基生物。没有剧本,没有演员,没有任何营销费用能买来这种场景。 这就是深庭纪创始人王弢和他的 Rover X3。 这个外形致敬初代 Macintosh 的双轮足机器人,可能是第一个跟人产生"化学反应"的硅基生命。它不追求像狗,反而让人产生感情。你很难把它归类成机器狗、也很难把它归类成玩具:它会盯着你看、会害羞、会自己跑去玩,还能把一群小孩硬控半小时。 这场对话持续了一个多小时。我们聊了“生命感”到底从哪来,聊了为什么要刻意“示弱”、为什么不急着做人形,聊了端侧智能怎么把机器人真正带去户外,聊了自动驾驶的方法论怎么迁移到“陪伴”,也聊了硬件创业为什么最后还是得离供应链更近。 机器人走进家庭,真正的第一形态,会不会就是这种“过渡型机器人”? 最后那段在斯坦福草坪上的现场验证,可能是我们录过最真实的PMF。 欢迎收听本期硅基立场,看硅基生命如何敲开家庭的门。 【主播】 硅星人创始人&硅基立场主理人 骆轶航 【嘉宾】 深庭纪创始人 王弢 【时间线】 01:35 "狗里狗气"的灵魂:为什么不像狗反而让人动情 03:05 致敬Macintosh:把童年最向往的伙伴带到户外 05:07 生命感的起点:它“注视着你”,你就开始上头 06:45 每一台Rover都有不同人格:千狗千面 08:35 硅基狗遛碳基狗:机器狗和真狗能共处吗 10:18 《黑镜》的阴影:为什么美国人害怕机器狗 12:20 Transitional Robots:人形机器人进家庭还太早 14:15 示弱的产品哲学:为什么不让机器人太聪明 17:05 功能价值包裹在情绪价值里:给用户一个买的理由 19:42 端侧AI:100%本地运算,不需要云端 22:15 双轮足的奥秘:六个电机为什么比十二个更聪明 25:40 从Drive.ai到深庭纪:自动驾驶老兵的机器人之路 28:50 物理交互的魔力:足球和Tag游戏的启示 32:10 斯坦福草坪上的PMF:被硬控半小时的孩子们 36:20 黑芝麻战略合作:国产芯片与贴身支持 39:50 硬件踩坑史:四足、轮足到双轮足的进化 44:30 为什么不去人形赛道:Momenta的启示 47:18 软硬结合:算法捅天花板,硬件不捅 50:05 未来迭代:身体可以长大,灵魂保持同一 53:40 陪伴机器人的终极形态:lifelong的家庭成员 【本期金句】 “你会觉得它注视着你——这就是生命感很强的一部分。”“承认它不像人那么聪明,有时候反而是做产品的优解。”“功能价值是锦上添花,内核还是情绪价值。”“一个身体里住几个灵魂,这感觉很不好。”“示弱是更好的策略:示强会带来高预期和侵入感。”“硬件可以升级,但灵魂(记忆/性格)要保留、要迁移。”“端侧做强,才能真的带去户外。”“离供应链更近,硬件迭代速度才能提上来。” 【关注我们】 本期播客同步视频版已上线,欢迎关注 b站:硅基立场Pro 视频号、抖音、小红书:硅星人 【互动】 你觉得“机器人进家庭”的第一形态,会是人形,还是这种“过渡型伙伴”? 如果只能二选一:更重要的是“生命感”还是“功能性”?欢迎留言。

76分钟
99+
1个月前
评价

空空如也

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧