学习使用 Llama_factory 成为 AI 模型训练专家

AI 前线

视频版:https://www.bilibili.com/video/BV1rbXsYyEaz 1. 前言 00:00 AI 模型训练,涉及非常多的概念和算法和系统设计, 学会了 Llama_factory,就成了 AI 模型训练的专家。 2. 基座模型的选择 01:23 从 ModelScope 上手工下载部署基座模型, https://modelscope.cn/models https://huggingface.co/models Llama_factory 的模型名称,略有瑕疵,用户要避免误解。 3. 模型训练的类型 05:32 Pre-training,SFT,RLHF,DPO,KTO,如何选择模型训练类型? 我们将单独做一期节目,分享我们的实战经验。 4. SFT 的训练方式 07:58 Full, freeze, lora, 其中普遍使用的是 LoRA,我们先从 LoRA 学起。 5. 量化和加速设置 08:51 flash_attention + liger_kernel 可以并用, 但是 unsloth 不能与它们并用。 6. 训练参数设置 11:57 略显草率的 UI 设计,用户要避免迷失, 通用的参数设置,与训练类型相关的参数设置,与训练类型相关的的补充设置, 以及训练结果的记录和分析,SwanLab, 不应该安排在页面同一个框内。 7. 数据集 16:07 先手工从 ModelScope 下载数据集, 下载完成后,然后再启动 Llama_factory, 哪些数据集,适用于哪些模型的哪些训练方法,需要阅读 Llama_factory 的 github pages, https://github.com/hiyouga/LLaMA-Factory/blob/main/data/README.md 8. 命令行 preview 18:25 前序 configs,都是为了设置这个命令行中的各个参数, 能否单独用 Unsloth?当然可以, 其实所谓单独使用 Unsloth,等同于手工设置命令行。 9. 训练与体验 19:57 训练过程,日志,与调优, 专业的冷门的问题,“请问,鹿角铲是装饰品,还是古代祭祀用的礼器,还是工具?” 10. 总结 24:32 学会了 Llama_factory,就成了 AI 模型训练的专家, 参考文献, 1. 知乎上的指南,“LLaMA-Factory QuickStart” (https://zhuanlan.zhihu.com/p/695287607), 2. Llama_factory 官方指南 (https://llamafactory.readthedocs.io/zh-cn/latest/), 3. Llama_factory 论文,“LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models” (https://arxiv.org/abs/2403.13372)。

28分钟
99+
7个月前

关于对 Manus 的质疑

AI 前线

1. 前言:几个问题 00:00 国内火国外不火,是炒作吗? Manus 是 AGI 吗? 与 Deepseek 是同等重要的进步吗? 2. Manus 与 Agent 00:43 Agent 通过 API 调用其它软件服务,Manus 用鬼手, 3. Manus 与 AGI 04:34 AGI 的五个等级,chatbot, reasoner, agent, innovator, orginazor, 更好用的 Agent,属于第 3 等级的优化, Deepseek 是推理者,属于第 2 等级的优化,第 2 等级并不低于第 3 等级, 国外不火的原因,美国更看重基础研究, 4. GAIA 测试 11:38 450 组数据, 三个等级,“照片中这几位宇航员,哪一位在太空飞行的总时间最长?” Huggingface 排行榜上暂时没有 manus, 5. Manus 的竞品,OpenAI 的 Deep Research 17:00 Deep Research 只操作浏览器,而 manus 理论上可以操作任何软件, Deep Research == re-search == exploratory search, 6. Manus 的竞品,Anthropic 的 computer use 20:43 一样:都试图操控电脑上所有软件, 不一样:Manus 部署在云端,Computer use 部署在个人电脑, 7. Manus 的竞品,AutoGPT 23:27 AutoGPT 是 Computer use 的先驱, Prompt 工程, 当年的大模型,做 planning 的质量不太好, AutoGPT 每一步的输出格式,难以控制, 8. Manus 能否部署在本地 27:56 云端部署的好处,在云端部署电脑软件,更可控, 云端部署的缺陷,云端能同时服务的客户人数,吞吐量有限, 发邀请码,不完全是因为搞饥渴营销,而是受制于吞吐量, 9. 在公司内网部署 Manus 是最优选择 29:42 个人电脑部署,非常麻烦, 公司内网部署是最优方案,部署还算方便,私域数据, 10. Manus 是否将开源 31:41 接通 Agent 私域数据, 开源将大大降低数据安全的担忧,有利于市场推广。

33分钟
2k+
8个月前

中国的 AI 逆袭战略

AI 前线

1. 中国在 AI 领域的逆袭战略 00:00 2. DS 出现以前,美国设定的 AI 行业格局 02:00 美国的四大 AI 寡头, 各国各企业 Agent 接入美国 AI 大模型, 3. DS 出现以后,全球 AI 将出现平权运动 04:28 算力平权:欧盟巴黎会议的潜台词, 数据平权:通过数据蒸馏,间接获得全网数据, 算法平权:Huggingface 的 SFTtrainer, 4. DS 出现以后,哪些问题没有改变 08:26 算力紧张仍然延续, 程序员仍然紧缺, 5. DS 出现以后,中国 AI 战略初步成型 11:23 舆论先行,AI 大模型个人用户大量涌现, 政府布置作业,各个企业开始做作业, 成功范例出现,榜样的力量是无穷的, 6. 企业落地 DS 的产品形态 16:38 出现各个行业的 AI 行业专家 7. 把 DS 落地到企业各个环节 18:54 1)市场营销:AI 咨询 + 媒体内容制作, 2)售前定制化方案:AI 设计, 3)销售合同: AI 法务, 4)供应链:AI 预测 + 区块链 5)ERP:智慧中台,智能制造,通用的工具箱 + 各个企业 IT 具体部署, 6)物流:四流合一,合同、发票、转账、仓库出入, 7)售后安装和维修:图文并茂的一步一步的指导, 客服只是覆盖了市场咨询营销和售后安装和维修两个环节, 8. 企业落地 DS 的步骤 29:04 1)租用公有云火山引擎 + DS,初步体验 RAG, 2)不改变 DS,外挂的行业 AI 专家模型, 3)对 DS 做 SFT + RL 再训练,内生的行业 AI 专家模型, 9. 行业 AI 专家模型的意义 33:17 行业话语权,一流的企业定标准, 中国将涌现出一大批 AI 工程师, 中国人的智力资源,将通过行业 AI 大模型这种产品形态,畅销全球, 巨大的市场,将促进中国 GPU 芯片研发。

36分钟
1k+
8个月前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧