本次邀请了我们邀请到了KAN的网络论文作者刘子鸣,关于KAN 的论文也引起业内广泛关注,目前其为MIT PHD第四年,导师为著名的宇宙学家Max Tegmark,今天他将带来KAN网络算法的相关内容,包括其背景、原理、应用和未来发展等方面。 💡关于「奇绩潜空间」: 我们找到了 GenAI 时代冲得最快的一批创业者 / Researchers ,如月之暗面(Moonshot AI)创始人杨植麟、AI 硬件 Rabbit-R1 创始人吕骋等,来分享自己的亲身经历和见解,希望可以为所有 GenAI 时代的创业者、从业者提供可借鉴、可复制的经验。 过去分享文字稿:奇绩社区内容精选 🎙️本期嘉宾: 刘子鸣: MIT PHD第四年,导师为著名的宇宙学家Max Tegmark 研究兴趣: AI 与物理学这两个领域的交叉,分为三个大的方向,一个是 Plysics of AI,像理解物理一样去理解 AI ; 第二个是 Physics for AI,如何用一些自然物理中的规律和0模型来启发我们设计更好的AI; 第三个方向是 AI for physics,就是我们怎样用 AI 物理学家来帮助人类物理学家进行科学发现。 ⏰时间轴 02:35 KAN(Kolmogorov-Arnold)是什么,其底层数学逻辑+优势是什么? 07:37 对比MLP,KAN的底层差异与结构差异在哪? 10:45 KAN在科学发展中的可解释性在哪? 12:24 颇有争议,为什么说KAN是AI+Science领域潜在"语言”模型? 24:24 回顾历史,符号主义与连接主义的来回摇摆,KAN属于何种? 28:03 哲学角度思考,为什么说KAN与 MLP 类似还原论与整体论的关系? 37:01 人们都说scaling law是大模型领域的牛顿第一定律,从你的科研背景上会如何理解Scalinglaw,有什么最新的认知? 👉【奇绩潜空间】报名通道 奇绩潜空间是 GenAI 时代冲得最快的一批科研学者/从业者/创业者聚集的 AI 人才社区,我们定期邀请大模型前沿创业者分享产品实践探索,如杨植麟、吕骋、闫俊杰等,邀请前沿科研学者分享最新技术进展,如姚顺雨、蔡天乐等。欢迎关注奇绩,报名添加小助手 🙋活动报名 & 听友群,欢迎扫码加小助手:
吴翼从清华大学交叉信息研究院教授到边塞科技的创始人兼CEO。本期播客,吴教授将分享——让大模型玩游戏,即狼人杀AI。 💡关于「奇绩潜空间」: 我们找到了 GenAI 时代冲得最快的一批创业者 / Researchers ,如月之暗面(Moonshot AI)创始人杨植麟、AI 硬件 Rabbit-R1 创始人吕骋等,来分享自己的亲身经历和见解,希望可以为所有 GenAI 时代的创业者、从业者提供可借鉴、可复制的经验。 过去分享文字稿:奇绩社区内容精选 🎙️本期嘉宾: 吴翼 :现任清华大学交叉信息研究院助理教授,同时于上海期智研究院做研究,主要研究方向包括多智能体强化学习,人机交互,机器人学习,自然语言理解与交互,机器学习系统等。目前在做AI创业,是边塞科技创始人&CEO。 吴翼在中学期间参加信息学奥赛,高一暑假保送清华,后来担任国家信息奥赛集训队队长。 在清华上学时代表学校征战ACM比赛;在伯克利做研究时师从Stuart Russell和Peter Abbiel,并作为早期的华人员工加入OpenAI。 ⏰时间轴 02:37 agent的概念是什么,强化学习agent和大模型agent的异同? 13:21 狼人杀有什么挑战性与难点,为何需要用大模型+强化学习去研究狼人杀,大模型的不足之处在哪? 17:18 做狼人杀游戏,在技术上要做哪几件事? 22:42 案例一:训练词频的影响下,如何调整first night AI的随机击杀倾向? 25:11 案例二:alignment 和 safety的限制下,如何训练AI选择optimal strategy? 36:06 从合作到竞争,为什么最后选择狼人杀游戏? 38:55 除了IO与大模型语言的一些结合点,RL与大模型语言有哪些比较好的结合点,实际中有哪些有趣的应用场景? 43:16 站在学术前沿角度,强化学习如今面临的一些瓶颈与挑战有哪些? 46:34 对GPT-5未来有什么推断,未来可能会有哪些进展? 47:14 如何更好地收集数据,不同模态的数据如何做融合与整合? 49:05 如何看待近期大火的机器人Figure?机器人有什么前沿进展? 50:59 怎么看机器人的进展速度? 👉【奇绩潜空间】报名通道 奇绩潜空间是 GenAI 时代冲得最快的一批科研学者/从业者/创业者聚集的 AI 人才社区,我们定期邀请大模型前沿创业者分享产品实践探索,如杨植麟、吕骋、闫俊杰等,邀请前沿科研学者分享最新技术进展,如姚顺雨、蔡天乐等。欢迎关注奇绩,报名……添加小助手 🙋活动报名 & 听友群,欢迎扫码加小助手:
作为 Luma AI 首席科学家和最早扩散模型加速算法的创建者,「宋佳铭 Jiaming Song 」在奇绩潜空间中分享了他对于微调视频模型以实现 4D 内容生成的探索思路,并通过讲解 Luma AI 在视频生成模型 DreamMachine 上的探索,说明了模型可以从视频数据中学到大量关键的三维特性。 💡关于「奇绩潜空间」: 我们找到了 GenAI 时代冲得最快的一批创业者 / Researchers ,如月之暗面(Moonshot AI)创始人杨植麟、AI 硬件 Rabbit-R1 创始人吕骋等,来分享自己的亲身经历和见解,希望可以为所有 GenAI 时代的创业者、从业者提供可借鉴、可复制的经验。 过去分享文字稿:奇绩社区内容精选 🎙️本期嘉宾: 宋佳铭 : Luma AI 首席科学家,斯坦福大学计算机科学博士、博士后。曾任职英伟达(DIR)小组科学家 ,创建了最早的扩散模型加速算法,该算法广泛用于最近的生成式 AI 系统,包括 DALL-E 2、Imagen、Stable Diffusion 和 ERNIE-ViLG 2.0。 ⏰时间轴 00:25 从 Diffusion 诞生到现在,视频生成领域有哪些重要的里程碑,这些里程碑发生的背后逻辑或动机是什么? 04:54 目前主流的研究者在进行视频理解和视频生成时,分别采用了什么样的技术路径? 05:23 从人和自然的角度,理解和生成是如何被分开的?其背后的机制是否相同? 06:36 在理解层面,多模态模型有 Late Fusion 和 Early Fusion 两条路径。你怎么看这两件事情在不同的场景下的区别,它们的优势和劣势是什么? 07:49 无论是 Early Fusion 还是目前使用的 DIT,大家都在期待 Auto-regressive 和 Diffusion 能更好地结合,你认为接下来的发展趋势可能是什么样的? 09:15 你当时做 diffusion 加速的时候,灵感来源于什么? 11:46 关于 4D 数据的收集,目前有用到模拟器合成数据吗?在自动驾驶领域,这类数据的重要性与其他领域有何不同? 14:17 DIT 的 scale 大概什么时候能出现?DIT 的参数大概能够达到一个什么范围? 16:21 明年下半年,如果要生成一段1080P、30秒的视频,所需的时间和成本可能是怎样的?那时的视频质量能否达到完全逼真的程度? 👉本周六 线下潜空间预告 主题:多模态大模型:以视觉为中心的探索 嘉宾:童晟邦,纽约大学计算机科学院博士,师从 Yann LeCun 教授和 Saining Xie 教授。他曾在伯克利人工智能实验室(BAIR)担任研究员,目前正在 Meta 暑期实习,近期获得了 OpenAI 超对齐奖学金 活动时间:北京时间 8月24日 10:00-13:00 活动地点:北京线下 / 上海线下 / 线上 均有场次 🙋活动报名 & 听友群,欢迎扫码加小助手:
💡关于「奇绩潜空间」: 我们找到了 GenAI 时代冲得最快的一批创业者 / Researchers ,让他们来分享自己的亲身经历和见解,希望可以为所有 GenAI 时代的创业者、从业者提供可借鉴、可复制的经验。 线下参与潜空间方式:扫描结尾二维码。 🎙️本期嘉宾: 蔡天乐:普林斯顿“小天才” ,美杜莎推理优化论文作者,曾任职谷歌、TogetherAi,MyShell模型核心贡献者、创业者、天使投资人。 毛圣博 Peter:奇绩创坛合伙人,Peter 的风险投资生涯始于启明创投,后来是熊猫资本联合创始人,累计14年风险投资经验,投资过旷视、Insta360、摩拜、七牛云等独角兽公司。 ⏰时间轴 01:38 在科研或者在工业界的经历上最有趣的洞察 05:48 怎么提升大模型推理的效率? 07:21 底层硬件更新周期 & 模型的更新周期的衔接 10:57 在模型和底层硬件愈加同质化的当下,如何做到推理层面的差异化 13:03 影响推理速度/效率的瓶颈 17:29 如何看待大模型市场的价格战争?厂商在赔钱赚吆喝吗? 22:30 关于天乐最新的论文:Medusa 美杜莎 30:52 除了Medusa美杜莎,还有哪些前沿的算法来优化推理效率/速度 32:47 《Large Language Models as Tool Makers》:让模型自己创建工具 36:10 端侧模型:降低成本、保护隐私 37:39 大模型数学比较差的原因? 40:46 超长上下文对推理的影响 43:01 大模型创业的竞争格局 📖本期提到的论文: * Medusa: Simple LLM Inference Acceleration Framework with Multiple Decoding Heads * Large Language Models as Tool Makers 👉本周六 线下潜空间预告 主题:多模态大模型:以视觉为中心的探索 嘉宾:童晟邦,纽约大学计算机科学院博士,师从 Yann LeCun 教授和 Saining Xie 教授。他曾在伯克利人工智能实验室(BAIR)担任研究员,目前正在 Meta 暑期实习,近期获得了 OpenAI 超对齐奖学金 活动时间:北京时间 8月24日 10:00-13:00 活动地点:北京线下 / 上海线下 / 线上 均有场次 🙋活动报名及听友群,欢迎扫码加小助手:
智能体(Agent)与真实世界互动的前沿研究者姚顺雨(清华姚班本科、普林斯顿大学博士),在【奇绩潜空间】与奇绩合伙人曹勖文(Xuwen)一起,分享了 ReAct Agent 的研究背景与动机,Agent 在大模型能力上的推理和决策优势,分析了 Agent 技术的挑战和未来发展,还介绍了自己的 SWE-Agent 研究项目等。姚顺雨的分享不仅涵盖了 Agent 技术的理论基础,还深入探讨了 Agent 商业化落地路径。这些内容能够帮助到 Agent 创业者找到创新机会,实现商业落地。
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧