EP5.1 CS336 语言模型:从基础到高效构建
斯坦福AI大模型

EP5.1 CS336 语言模型:从基础到高效构建

8分钟 49 10个月前
节目简介
来源:小宇宙
这些材料来自斯坦福大学CS336课程的首次讲座,该课程名为“从头开始构建语言模型”。本次讲座由Percy和Tatsu主讲,概述了课程内容和目标。课程旨在让学生端到端地理解构建语言模型的完整流程,涵盖数据、系统和建模方面。讲座强调了亲自动手构建的重要性,因为研究人员与底层技术的联系日益减弱。尽管前沿模型因其规模和成本而遥不可及,但学生仍将学习机制、思维模式和直觉,以在计算和数据预算有限的情况下构建最优模型。课程还将深入探讨标记化(特别是字节对编码)以及优化效率的系统方法。

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧