What's Next｜科技早知道

人形≠通用≠落地：人形机器人的真问题| S9E15

62分钟 1.96万 1年前

主播

声动活泼的声小音 18 档播客

丁教Diane 2 档播客

Yaxian 2 档播客

节目简介

来源：小宇宙

它们会跳舞、跑马拉松、在工厂打螺丝……人形机器人正在从科幻走向现实。马斯克说 Optimus 是 Tesla 的未来，国内创业者与资本也纷纷跟进，具身智能进入技术竞速新阶段。

据统计，2025 年仅前两个月，中国人工智能领域的投资交易额就已经逼近 2024 年全年的总额，达到数百亿规模，全球范围内，谷歌、微软等科技巨头也在加速布局具身智能赛道。

但——人形真的有必要吗？VLA 模型真的能「端到端」控制机器动作？我们距离真正的落地应用还有多远？

本期《科技早知道》邀请峰瑞资本执行董事刘鹏琦与人大高瓴人工智能学院副教授胡迪，与丁教和雅娴一起，聊聊这场尚未形成共识的技术狂奔。一起深入具身智能的关键分歧、成本难题与哲学困境。

关于 MiniMax Speech-02 模型

MiniMax 推出的全新升级的语⾳模型 Speech-02，在两项权威榜单：Artificial Analysis Speech Arena 和 Hugging Face TTS Arena 中，双榜位列全球第一。

Speech-02 具有⾜够泛化的模型能⼒，为用户提供超拟⼈、个性化、多达 32 语种的语⾳服务。

MiniMax Speech 也刚刚发布了技术报告，如果你对技术细节感兴趣，欢迎点击链接查看，想用 MiniMax Speech 来打造属于自己的声音，欢迎点击链接尝试：国内；海外

Untitled

本期人物

丁教 Diane，「声动活泼」联合创始人、「科技早知道」主播

刘鹏琦，峰瑞资本执行董事

胡迪，中国人民大学高瓴人工智能学院副教授

Yaxian, 「科技早知道」节目监制

主要话题

[03:07] 人形机器人热潮从哪来？Optimus、马拉松赛事与特斯拉的野心

[08:36] 机器人一定要人形么？人形 vs 实用性的争议

[14:23] 通用机器人=终极目标？从泛化能力聊起

[24:30] 触觉感知、力反馈、可靠性，机器人上肢发展的现实瓶颈

[36:08] 大模型的路线之争：端到端（VLA ）模型 vs 模块化控制路径

[47:03] 训练数据从哪来？仿真 vs 真机 vs 互联网模仿学习

[51:47] 人形机器人落地的不可能三角：成功率、通用性与成本如何取舍？

[59:12] 家庭机器人、可控核聚变、量子芯片，哪个会先实现？

幕后制作

监制：Yaxian

后期：Jack

运营：George

设计：饭团

延伸阅读

VLA模型

VLA 是视觉 - 语言 - 动作（Vision - Language - Action）大模型的简称，是一种先进的多模态机器学习模型。它能让机器人接收环境信息和语言指令，经理解、推理与决策后，转化为动作指令来控制机器人运动，以实现与物理世界的交互。

内容研究志愿者招募

Hi 你好呀，这里是「科技早知道」内容研究志愿者招募。如果你是前沿科技行业的从业者（包括但不限于半导体、先进制造、计算机、AI、生物医药、航空航天等等），欢迎加入我们分享你在行业内的一手观察和见解。

你将有机会参与到节目的制作当中，你的知识和见解也可能成为未来节目的一部分！

志愿者招募入口

加入声动活泼

声动活泼目前开放全职设计师、商业发展经理、商业内容策划、内容编辑实习生、早咖啡内容研究实习生、社群运营实习生等6个职位，详情点击招聘入口

商务合作

声动活泼商务合作咨询

Untitled

关于声动活泼

「用声音碰撞世界」，声动活泼致力于为人们提供源源不断的思考养料。

我们还有这些播客：声动早咖啡、声东击西、吃喝玩乐了不起、反潮流俱乐部、泡腾 VC、商业WHY酱、跳进兔子洞、不止金钱

欢迎在即刻、微博等社交媒体上与我们互动，搜索 声动活泼 即可找到我们。

期待你给我们写邮件，邮箱地址是：[email protected]

欢迎扫码添加声小音，在节目之外和我们保持联系。

Special Guests: 刘鹏琦 and 胡迪.

小宇宙热评

NX21240

1年前浙江

还是找业界的嘉宾听起来接地气，学校里的教授改不了泛泛而谈的毛病，说的内容提供的新信息含量还不如问大模型。

Jolin_乔琳

1年前北京

这个开头也太像了吧！minimax 这次的语音模型确实有点厉害！

大大福气万万

1年前北京

01:17 开头完全没有违和感！绝了！

沂蒙山雾雨

1年前上海

开头好牛

jhwei

1年前北京

两位嘉宾有一点“两极”的意思，追求完美解决方案的研究人员，和追求落地回报的投资人员，能听出来两位在自己的领域都是有很深的积累的。个人观点，有时候的技术落地时刻，并没有达到完美解决问题的时刻。回头看自动驾驶“端到端”火起来的时候，其实很多人是不信的，但是很快大家就都开始转向端到端。有时候学术界和工业界是需要相互扶持的。

nene请说

1年前北京

00:43 我靠开头居然是minimax模仿yaxian的声纹！！完全听不出

Bright869

1年前美国

不太认同说机器人不是必需品。T型车被造出来之前也没人觉得车是必需品，受到马车厂商推动，不少地方甚至禁止汽车。

wong1908

1年前北京

44:59 作为一个投资人想说，“人人都需要车”是个谬误，“不是人人都需要机器人”也是个谬误，甚至可以说，“人人都需要出行”在未来也会是谬误。不如说是汽车已经充分实现了全社会的心智认知，而机器人还没有——至少这个评论区中一半以上的评论，都反映出大家还没有在“机器人是什么”这个根本问题上形成共识。这个问题需要15-20年后给出答案。