在具身智能爆火2年之后,在2024年的年尾,我们聊一个理想很丰满但现实很骨感的问题:具身智能可靠性!这次论坛,我们邀请了在解决可靠性问题最有机会的两条路线,RL和model based control的代表性学者,来一起交流如何将机器人可靠性逼进99.9x%大关。
这期栏目是一个在线Panel的录音,邀请到的嘉宾是(嘉宾介绍以姓氏拼音顺序):
罗剑岚是伯克利人工智能研究(BAIR)实验室的博士后学者,与Sergey Levine教授合作。2022年回到学术界全职工作之前,他在Google [X]担任研究员,与Stefan Schaal教授合作了两年。他于2020年在加州大学伯克利分校获得硕士和博士学位,还曾在DeepMind和Everyday Robots工作过。罗剑岚在强化学习+真机这条路线上持续深耕七八年,也于近期推出强化学习+真机这条路线上非常有代表性的两篇工作SERL和HiI SERL。
卢宗青现任北京大学计算机学院长聘副教授,国家级青年人才,智源学者。主要研究方向是强化学习、多模态大模型、通用智能体。旨在赋予智能体自主获取技能、决策与推理能力,在开放世界中完成复杂任务、合作和交流,迈向通用人工智能。
石冠亚是卡内基梅隆大学(CMU)机器人研究所和计算机科学学院的助理教授,领导 LeCAR 实验室(Learning and Control for AgileRobotics),于2022年在加州理工学院(Caltech)完成博士学位:导师为Soon-Jo Chung和Yisong Yue。2017年,他获得清华大学工学学士学位。从2022年到2023年,他在华盛顿大学保罗·G·艾伦计算机科学与工程学院担任博士后学者,与Byron Boots合作。
朱秋国是云深处创始人兼CEO,同时也是浙江大学控制科学与工程学院副教授,主要研究领域为仿生机器人和机器智能,主持研制人形机器人“悟空”、四足机器人“绝影"以及四轮足机器人“山猫"。他于2008年获得浙江大学机械工程学士学位,2011年和2020年分别获得浙江大学控制科学与工程硕士和博士学位。他也是云深处科技(DEEP Robotics)的创始人,云深处是全球四足机器人行业应用的引领者,自主研发的“绝影"系列机器人在国际同类产品中已经达到先进水平,并率先在电力、消防、隧道、安防等领域投入使用。
播客目录:
01:00 嘉宾介绍
04:30 在智能机器人浪潮来临之前就选择了这个方向,浪潮来临前后的感受
14:16 RL和Control之于Locomotion
15:20 石冠亚:如何将RL和Control结合
26:20 朱秋国:RL和Control在产业和学术方面的应用
33:05 卢宗青:RL对人形机器人的控制
37:00 罗剑岚:RL+真机
48:00 石冠亚:Leaning在操作上的路径怎么看
55:22 罗剑岚:Leaning在操作上的路径对比
69:00 对人形机器人的控制什么时候可以达到可靠
69:30 卢宗青:基于RL的路线做人形控制结合真机数据
73:20 卢宗青:人形达到99%可靠性需要多久?
76:20 朱秋国:目前行业应用的可靠性如何?人形什么时候可以达到今天四足的可靠性?
83:00 石冠亚:现在人形机器人的控制迭代速度如何看待?
91:27 RL的算法是否应该对机器人领域做一些理论的创新?
101:40 对机器人方向的学生如何调节迷茫期?
罗剑岚主页:https://people.eecs.berkeley.edu/~jianlanluo/
石冠亚主页:https://www.gshi.me/
朱秋国主页:https://person.zju.edu.cn/0011353/657053.html
云深处主页:https://www.deeprobotics.cn/
卢宗青主页:https://www.ai.pku.edu.cn/info/1139/2783.htm
访谈中提到的工作:Diffusion Policy、Hil-SERL、SERL、H2O、OmniH2O、ABS、AnyCar等,可以过几天查看石麻笔记公众号,会有具体查看访谈的总结,会有更多关于论文以及方法的细节。
因为是学术访谈,并且嘉宾很多在海外,所以涉及很多学术名词会用英文表达。这里简单罗列一些英文名词:
RL:Reinforcement Learning 强化学习
Control:控制,特指基于模型的控制(Model Based Control)
Humanoid:人形机器人
Sim:仿真,是一种机器人训练常用的仿真器
Sim2Real:仿真到现实,虚拟到现实的转化
欢迎关注ReSpark同名公众号ReSpark,记录AI和物理世界融合过程中的精彩商业访谈内容。欢迎关注石麻笔记,记录AI和物理世界融合的学术成果。

空空如也
暂无小宇宙热门评论