Album
时长:
62分钟
播放:
1.96万
发布:
7个月前
简介...
https://xiaoyuzhoufm.com

它们会跳舞、跑马拉松、在工厂打螺丝……人形机器人正在从科幻走向现实。马斯克说 Optimus 是 Tesla 的未来,国内创业者与资本也纷纷跟进,具身智能进入技术竞速新阶段。

据统计,2025 年仅前两个月,中国人工智能领域的投资交易额就已经逼近 2024 年全年的总额,达到数百亿规模,全球范围内,谷歌、微软等科技巨头也在加速布局具身智能赛道。

但——人形真的有必要吗?VLA 模型真的能「端到端」控制机器动作?我们距离真正的落地应用还有多远?

本期《科技早知道》邀请峰瑞资本执行董事 刘鹏琦 与人大高瓴人工智能学院副教授 胡迪,与丁教和雅娴一起,聊聊这场尚未形成共识的技术狂奔。一起深入具身智能的关键分歧、成本难题与哲学困境。



关于 MiniMax Speech-02 模型

MiniMax 推出的全新升级的语⾳模型 Speech-02,在两项权威榜单:Artificial Analysis Speech Arena 和 Hugging Face TTS Arena 中,双榜位列全球第一。

Speech-02 具有⾜够泛化的模型能⼒,为用户提供超拟⼈、个性化、多达 32 语种的语⾳服务。

MiniMax Speech 也刚刚发布了技术报告,如果你对技术细节感兴趣,欢迎点击链接查看,想用 MiniMax Speech 来打造属于自己的声音,欢迎点击链接尝试:国内海外

Untitled



本期人物

丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播

刘鹏琦,峰瑞资本 执行董事

胡迪,中国人民大学高瓴人工智能学院 副教授

Yaxian, 「科技早知道」节目监制



主要话题

[03:07] 人形机器人热潮从哪来?Optimus、马拉松赛事与特斯拉的野心

[08:36] 机器人一定要人形么?人形 vs 实用性的争议

[14:23] 通用机器人=终极目标?从泛化能力聊起

[24:30] 触觉感知、力反馈、可靠性,机器人上肢发展的现实瓶颈

[36:08] 大模型的路线之争:端到端(VLA )模型 vs 模块化控制路径

[47:03] 训练数据从哪来?仿真 vs 真机 vs 互联网模仿学习

[51:47] 人形机器人落地的不可能三角:成功率、通用性与成本如何取舍?

[59:12] 家庭机器人、可控核聚变、量子芯片,哪个会先实现?



幕后制作

监制:Yaxian

后期:Jack

运营:George

设计:饭团



延伸阅读

VLA模型

VLA 是视觉 - 语言 - 动作(Vision - Language - Action)大模型的简称,是一种先进的多模态机器学习模型。它能让机器人接收环境信息和语言指令,经理解、推理与决策后,转化为动作指令来控制机器人运动,以实现与物理世界的交互。



内容研究志愿者招募

Hi 你好呀,这里是「科技早知道」内容研究志愿者招募。如果你是前沿科技行业的从业者(包括但不限于半导体、先进制造、计算机、AI、生物医药、航空航天等等),欢迎加入我们分享你在行业内的一手观察和见解。

你将有机会参与到节目的制作当中,你的知识和见解也可能成为未来节目的一部分!

志愿者招募入口



加入声动活泼

声动活泼目前开放全职设计师、商业发展经理、商业内容策划、内容编辑实习生、早咖啡内容研究实习生、社群运营实习生等6个职位,详情点击招聘入口



商务合作

声动活泼商务合作咨询

Untitled



关于声动活泼

「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。

我们还有这些播客:声动早咖啡声东击西吃喝玩乐了不起反潮流俱乐部泡腾 VC商业WHY酱跳进兔子洞不止金钱

欢迎在即刻、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。

期待你给我们写邮件,邮箱地址是:[email protected]

声小音

欢迎扫码添加声小音,在节目之外和我们保持联系。

Special Guests: 刘鹏琦 and 胡迪.

评价...

空空如也

小宇宙热门评论...
NX21240
7个月前 浙江
31
还是找业界的嘉宾听起来接地气,学校里的教授改不了泛泛而谈的毛病,说的内容提供的新信息含量还不如问大模型。
Jolin_乔琳
7个月前 北京
9
这个开头也太像了吧!minimax 这次的语音模型确实有点厉害!
大大福气万万
7个月前 北京
6
01:17 开头完全没有违和感!绝了!
沂蒙山雾雨
7个月前 上海
4
开头好牛
jhwei
7个月前 北京
2
两位嘉宾有一点“两极”的意思,追求完美解决方案的研究人员,和追求落地回报的投资人员,能听出来两位在自己的领域都是有很深的积累的。 个人观点,有时候的技术落地时刻,并没有达到完美解决问题的时刻。回头看自动驾驶“端到端”火起来的时候,其实很多人是不信的,但是很快大家就都开始转向端到端。有时候学术界和工业界是需要相互扶持的。
nene请说
6个月前 北京
2
00:43 我靠 开头居然是minimax模仿yaxian的声纹!!完全听不出
Bright869
7个月前 美国
2
不太认同说机器人不是必需品。T型车被造出来之前也没人觉得车是必需品,受到马车厂商推动,不少地方甚至禁止汽车。
wong1908
6个月前 北京
2
44:59 作为一个投资人想说,“人人都需要车”是个谬误,“不是人人都需要机器人”也是个谬误,甚至可以说,“人人都需要出行”在未来也会是谬误。 不如说是汽车已经充分实现了全社会的心智认知,而机器人还没有——至少这个评论区中一半以上的评论,都反映出大家还没有在“机器人是什么”这个根本问题上形成共识。 这个问题需要15-20年后给出答案。
声动活泼的声小音
7个月前 北京
2
MiniMax 推出的全新升级的语⾳模型 Speech-02,通过⾜够泛化的模型能⼒,为用户提供超拟⼈、个性化、多样性的语⾳服务。如果你对该模型感兴趣,可以在 shownotes 中查看详情~
是迦棋呀
6个月前 北京
1
这个开头竟然是生成的人声!牛呀,还挺像的!
HD495442h
7个月前 英国
1
嘉宾水平很一般
无聊的猪
7个月前 江苏
1
29:29 压敏电阻是电压敏感型啊
奥本山默
7个月前 广东
0
说的非常好,很认同
RoyZ
6个月前 上海
0
36:43 哈,我毕业设计也是做的机器人手臂设计
鱼刺fd
6个月前 广东
0
没必要人形,特定场景的优化的智能机器人才是最优解吧。比如双足可没有轮式跑得快啊?还耗能
ShD3
6个月前 广东
0
请的嘉宾质量真的太一般了😓
羊小凡
5个月前 美国
0
我最喜欢的podcast awwwww
章倩
4个月前 北京
0
感知维度、决策维度的增加带来数据、末端控制精度速度数量级的增加 硬件:电机 减速器 力的感知与反馈
章倩
4个月前 北京
0
不可能三角:成功率 通用性 成本
Jasmine_O1aJ
2个月前 安徽
0
47:01 VLA落地问题
Jasmine_O1aJ
2个月前 安徽
0
48:27 视频数据,摇操,仿真数据三种采集方式
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧