Deepseek的第三次战役：国产AI如何挑战OpenAI？

68分钟 4,487 1年前

主播

节目简介

来源：小宇宙

1. Deepseed 的三大战役 00:00
2. 多模态竞争格局 03:15
3. 多模态技术现状与缺陷 09:11
4. 统一场多模态的初步尝试 14:35
4.1 清华唐杰教授的 CogVLM 22:04
4.2 Yang LeCun 和谢赛宁教授的 MetaMorph 27:46
5. Janus-pro 系统架构 30:59
5.1 Adaptors + Pretained Encoders 31:24
5.2 AutoRegressive Transformer + Rectified Flow Model 33:48
6. 模型训练成了炼金术 37:05
6.1 分成三个阶段来训练 38:58
6.2 每个阶段的时长的配比 40:41
6.3 每个阶段不同类型数据的配比 42:26
7. 训练成本 48:20
8. 两个先进武器迎战最后的决战 51:12
8.1 用流体力学来生成图像 52:45
8.2 当多模态与 MLA 和 MoE 融合 62:48
9. 总结 66:10
1. Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling
2. JanusFlow: Harmonizing Autoregression and Rectified Flow for Unified Multimodal Understanding and Generation
3. CogVLM: Visual Expert for Pretrained Language Models
4. MetaMorph: Multimodal Understanding and Generation via Instruction Tuning

评价

空空如也

小宇宙热评

張小米粒

11个月前江苏

主播的南京口音好重

Lalania-D

1年前四川

声乐有点低，听起来有点费力。

__noble__

1年前北京

00:32 v3主要是讲工程优化吧

谈得来

10个月前吉林

其实普通人真的用deepseek做不了什么，实实在在说，现在人工智能大模型无非就是组稿、生成图片、制作小视频，可是每天搬砖打工的人也不写报告也不做设计，冷静冷静吧，人工智能发展基础是替代人类大量算力而产生的，所以不要盲目追风，踏踏实实做事劳动赚钱才是最美的。目前网络上充斥着卖deepseek教程的，线下培训班等等要理性消费。一些重复性大数据分析或者筛选或者重组才是人工智能的需求，例如海量信息中如何找到自己想要的贴合自己需求的需要deepseek去深度输出，再有设计图片想要效果图他会快速成型，再修图。还有，本地部署是收费的，而且调用不同API也得根据数据收费，所以不要过度宣传，人工智能还在初级阶段，而且把更多算力释放给科研人员，让他们培养更加智能的大模型造福解放劳力！支持播主的普及科技方法。加油加油加油