BigZ Mei
暂无简介...

BigZ Mei 听友
BigZ Mei
未知
暂无简介
Ta订阅的频道...
硅谷101
分享当下最新鲜的技术、知识与思想
失败、背叛、不被理解,硅谷精神领袖一直都不是完美的存在;他们是科学家,创造者,行动派,他们有独立的价值观。《硅谷101》是由媒体人泓君发起的深度访谈节目,是一档分享当下最新鲜的技术、知识与思想的科技播客。 公众账号:硅谷101 联系邮箱:[email protected]
不开玩笑 Jokes Aside
由猫头鹰喜剧出品
一档时而开玩笑,时而不开玩笑的播客节目,由猫头鹰喜剧出品。 公众号“猫头鹰喜剧”回复“听友群”,小助手会把你拉进群聊~
忽左忽右
基于经验视角提供内容的文化类播客
「忽左忽右」是一档文化沙龙类播客节目,试图为中文播客听众提供基于经验视角的话题和内容。本节目由JustPod出品。
怡楽播客
打造符合当代年轻人生活情趣的播客
是一档以生活漫谈为主的爆米花播客!2016年成立于北京
Vibration 歪波音室
音乐太多,耳朵太少
音乐太多,耳朵太少
Ta最近收听的节目...

E206|临近机器人GPT-3时刻,具身智能开源模型的加速演进

硅谷101

今年机器人模型领域最重要的突破,就是模型的通用性大幅提升,开始了泛化能力的探索,与此同时,这个行业依然面临着长尾问题、数据采集、缺乏统一维护平台等挑战,这期节目我们就来聊聊,业内将如何面对这些挑战?中国和美国的机器人发展路径又有何区别? 本期节目我们邀请了中国具身智能公司自变量机器人的CTO王昊,在这期节目上线时,他们刚开源了大规模真实数据训练的端到端具身基础模型WALL-OSS;以及来自美国具身智能公司Physical Intelligence的研究员柯丽一鸣(Kay Ke),她是π₀、π₀.₅论文作者。 在节目中,嘉宾们表示目前具身智能模型已达到了GPT-2的水平,在最近2到3年将优先在半结构化场景应用,那么我们距离全场景的通用机器人又还有多远?机器人公司又该如何平衡商业化与研发的节奏? 【主播】 泓君,硅谷101创始人,播客主理人 【嘉宾】 王昊,自变量机器人CTO 柯丽一鸣(Kay Ke),Physical Intelligence研究员,π₀、π₀.₅论文作者 【硅谷101科技峰会】 《硅谷101》的年度科技大会又回来了,这是我们将有趣的技术干货与故事带到线下的第二年,用最好的内容让大家亲身感受前沿科技的酷炫和温度一直是硅谷101的目标。硅谷10月5日,期待与各位见面,从这里驶向未来! 欢迎点击前往购票地址,输入粉丝专属折扣码“VALLEY101FANS”,享85折优惠。 【蚂蚁外滩大会】 硅谷101播客主理人泓君将主持9月11日~12日在上海举行的蚂蚁外滩大会,聊聊AI时代的全球趋势和创新最前沿,感兴趣的朋友欢迎点击领取硅谷101粉丝专属参会凭证。 【你将听到】 行业突破与泛化能力 05:36 2025年关键进展:模型通用性提升,开始泛化能力探索 07:38 何为模型泛化能力:从熟悉环境到陌生环境的能力一致性 11:44 泛化核心难点:长尾问题、数据采集与缺乏标准评测体系 16:04 如何评判具身智能模型能力:对比任务学习数据量与现实应用表现 数据挑战与硬件瓶颈 17:17 其他两大难点:数据质量与数量平衡、硬件维护缺乏统一平台 20:03 为何需要至少100万小时的数据,才能构成优秀的大模型? 23:06 人类VS机器人学习机制对比:人类的进化已包含了“预训练” 27:14 合成数据在机器人领域的应用:降低数据收集成本,但难以模拟现实物理交互 模型架构与技术路径 31:35 具身智能开源模型WALL-OSS发布:上万小时真实数据,补足当前开源模型的欠缺能力 35:36 WALL-OSS模型开源动机与优势:降低研究门槛,加速生态创新 38:03 架构之争:端到端统一训练VS分层系统设计,模型技术路径尚未统一 40:58 从VLA(视觉语言模型)出世后,具身智能模型路线开始走向趋同化 44:10 具身模型已达到GPT-2的水平,将在1~2年时间达到GPT-3水平 45:31 中美机器人技术路径区别:美国自上而下、先做大模型,中国从现实需求出发、双轨并行 52:31 抓到耗子的都是好猫:算法与操控的难度平衡 54:12 模型高频控制的意义:对未来情况做决策,但更高频率无意义 58:13 视觉难以对未来做精确的预测和建模,但能弥补触觉缺失与力的反馈 01:00:20 传感器比想象更成熟,但机器人还是依赖视觉作为主要训练参数 商业化与落地前景 01:01:31 家用机器人预测:2~3年内进入半结构化场景,5~10年全场景使用 01:05:29 如何平衡商业化与研发:尽可能服务于开放式场景,提高公司组织能力 01:08:43 现实部署的机器人量越大、场景越多样,数据反馈和模型迭代效果将越好 【节目中提到的相关公司和术语】 * Physical Intelligence (PI):美国具身智能公司,推出了π₀、π₀.₅模型 * 自变量机器人:中国具身智能公司,开源了端到端具身基础模型WALL-OSS * RT-2:Robotics Transformer 2,谷歌DeepMind推出的新一代AI学习模型 * Genie3:谷歌世界模型的第3代,是DeepMind首个支持“实时交互”的世界模型 * VLA:Vision-Language-Action,视觉-语言-动作模型架构 * Covariant Robotics:一家专注于机器人大脑软件开发的硅谷公司 * 长程任务:Long-Horizon Task,包含一系列连续步骤、需要机器人进行多步推理、规划并执行,最终才能完成的复杂任务 【监制】 泓君 【后期】 AMEI 【运营】 王梓沁、孙泽平 【BGM】 Ever Forward - Francis Wells Mixed Emotions - Arthur Benson Supine - Peter Sandberg 【在这里找到我们】 公众号:硅谷101 收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓FM|荔枝FM|网易云音乐|QQ音乐 其他平台:YouTube|Bilibili 搜索「硅谷101播客」 联系我们:[email protected] Special Guests: 柯丽一鸣 and 王昊.

70分钟
12k+
4天前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧