节目列表: AI 前线 - EarsOnMe - 精选播客，一听即合

中国企业能否入驻美国本土

中美竞争日趋激烈，川普政府为了限制中国产品进入美国市场，不仅对中国加税，而且对墨西哥加拿大也严厉加税。中国企业是否可以直接入驻美国本土？哪些企业容易入驻，哪些企业不容易。

18分钟

80

十五分钟讲解 Deepseek 从 R1-zero 到 R1 的再训练

昨天花了 15 分钟，讲解 Deepseek R1-zero 的训练过程，节目播出后，收到若干听众反馈，其中有听众想了解，如何把 Deepseek 这个通用大模型，进行专项训练，使之与企业的专业知识和内部数据库相结合，成为具有企业特色的专项模型？我们这一期花十五分钟时间，先讲解港大马毅教授的新作，“监督微调增强记忆，强化学习举一反三”，然后讲解 Deepseek R1 论文的第二部分，如何对 Deepseek R1-zero 进行专项训练，强化专业知识，避免违规言论，从而对 Deepseek R1-zero 再训练，进化成 R1，最后讲讲，如何对 Deepseek R1 进行数据蒸馏，套出 Deepseek R1 的优选数据，用于训练小型模型，让小型模型具备大型模型的专业知识和严谨推理的能力。之所以暂时没有讲 Agent 和 LoRa 这些传统的做法，是因为感觉到 Deepseek 有可能会颠覆性重构 AI 大模型本身以及下游应用范式，所以，暂时先放下传统的 Agent 和 LoRa，放下执念，清空大脑，腾出空间，迎接 Deepseek 的颠覆性创新。

20分钟

Deepseek 与 AI 蓝翔技校

中美围绕芯片、AI、和机器人的经济和技术领域的局部竞争，已经演变为国家战略层面的竞争。中美都输不起，中国如何打赢这场战争？

27分钟

十五分钟讲解 Deepseek R1-zero 训练过程

2025年1月31日，OpenAI 发布了 O1 模型的改进版 O3 mini， O3 mini 进行推理思考时，英文和中文混着讲，一会儿英文一会儿中文。 OpenAI O3 mini 是否蒸馏了 Deepseek 模型？要回答这个问题，我们要先了解 OpenAI 的内部工作流程，Deepseek 的内部工作流程，然后两者横向比较，本期节目花 15 分钟，用普通人都能听得懂的语言，读解 Deepseek R1-zero 模型的工作原理。

21分钟

Deepseek与产业链

中美两国围绕芯片、AI 和机器人的经济竞争，正在演变成大国国家战略的竞争。中国如何打赢这场战争，长处和短板分别在哪里，如何发扬优势，弥补或规避短板？

11分钟

Deepseek 如何反驳 OpenAI 的蒸馏指控

万一 OpenAI 发起法律诉讼，指控 Deepseek 通过数据蒸馏的办法，违法盗用 OpenAI 的数据，Deepseek 可以从哪几个点，反驳 OpenAI ？先科普数据蒸馏的技术原理，然后分析 OpenAI 诉讼的软肋，最后猜测 Deepseek 的反击策略。

23分钟

Deepseek 与中美芯片战争

Deepseek 横空出世，导致英伟达股价重挫 17%，这事基本属于短期震荡。但是英伟达可能面临比股价下降更可怕的局面，因为 Deepseek 剥开了 CUDA 框架的外壳，直接使用 PTX 汇编语言和指令集，一旦指令集被 Deepseek 这类团队深入研究，或许 Deepseek 这些团队会提出新的指令集，一旦有了新的指令集，就会有华为等等厂家，制造比英伟达 GPU 算力更强大的芯片，如果出现这种局面，英伟达或许重蹈 Intel 的覆辙。

9分钟