Album
时长:
58分钟
播放:
331
发布:
8个月前
主播...
简介...
https://xiaoyuzhoufm.com
1. Unsloth 有什么用? 00:00
Unsloth 训练行业专家模型 00:12
Unsloth 的 4 个核心技术 03:40
1.
2. 解密 Flash Attention 06:23
GPU 硬件架构 06:33
Kernel fusion 11:02
Matrix tiling 16:03
Softmax statistics 18:30
Recompute for backward pass 19:47
1.
3. 重写 Triton kernels 24:04
1.
4. 优化矩阵链乘法 27:35
多个矩阵相乘时,计算成本与顺序相关
1.
5. 手工实现 AutoGradient 31:12
AutoGradient 解决什么问题 32:33
为什么 Unsloth 要手工实现 AutoGradient,如何手工写 34:02
1.
6. 解密 LoRA 37:54
什么是矩阵的秩 rank 38:06
LoRA 牺牲模型精度,换取训练速度 39:06
LoRA 编程不太难 42:07
1.
7. GaLore 全面超越 LoRA 45:11
把整个梯度空间拆解为若干子空间 45:24
GaLore 与 LoRA 哪些相同哪些不同 47:15
1.
8. 用 Llama_factory 实操 Unsloth + GaLore 50:58
复盘 Unsloth 和 GaLore 的核心原理 50:58
Llama_factory 设置与运行结果 52:04
评价...

空空如也

小宇宙热门评论...
邓侃AI
8个月前 北京
4
视频版: https://www.bilibili.com/video/BV1HSZVYFEJ6
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧