Album
时长:
46分钟
播放:
653
发布:
7个月前
主播...
简介...
https://xiaoyuzhoufm.com

1)  AGI vs ADI, 行业专家大模型   00:00



2)  Agent   05:35    

  2.1 RAG   05:39    

  2.2 Deep Research   06:38    

  2.3 Self-memory   09:03    

  2.4 Multi-agents RL  10:57



3)  大模型与大算力   12:11    

  3.1 Transformer 架构与算力消耗    13:38    

  3.2 GPU 内存与硬盘    14:57    

  3.3 FlashAttention   17:02



4)  Adapter 19:24    

  4.1 Low Rank Adapter (LoRA)   19:51    

  4.2 GaLore   21:33    

  4.3 K-adapter   23:14



5)  Mixture of Experts   24:14    

  5.1 Mistral   24:29    

  5.2 Deepseek-V3   26:12



6)  RL for reasoning   28:00    

  6.1 RLHF & PPO   28:22    

  6.2 GRPO   29:13    

  6.3 多轮对话的话术   30:56



7)  像专家那样说话   33:56    

  7.1 Direct Preference Optimization (DPO)   34:32    

  7.2 Kahneman-Tversky Optimization (KTO)   36:44



8)  数据与标注 37:51    

  8.1 数据蒸馏   38:29    

  8.2 Monto Carlo Tree Search 做推理标注   40:28



9)  GRPO + LoRA 实战   43:02    

  9.1 编程和数据   43:17    

  9.2 测试   44:50

评价...

空空如也

小宇宙热门评论...
ExiledDestin
7个月前 江西
0
太棒了,讲得很好
ExiledDestin
7个月前 江西
0
郑教授,我在政府智库工作,想请您来讲课的话怎么联系您?
孤独的观测者_IuCf
6个月前 上海
0
论文链接可以分享下吗?
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧