
时长:
65分钟
播放:
2.11万
发布:
5个月前
简介...
Hi hi 大家好,我上周末把DeepSeek V3的technical report看完了,明白了很多事情,这期给大家讲讲我学到的东西,即便不做模型的同学也能听懂。
我会在播客里给大家普及V3和R1这两个模型的概念、大模型概念,以及广义和狭义人工智能的区别。
还会谈到DeepSeek模型的特点,比如V3大语言模型优势,和它对AI生态的积极影响。
我们还讨论了,在美国限制英伟达出口的情况下,幻方量化是怎么通过GPU囤货,通过技术手段突破算力限制、增强了数学稳定性,让美国专家破防的。
我看完report之后,觉得“世界破破烂烂,小梁缝缝补补”。
我会在播客里告诉大家为什么我会这样想,为什么对梁文锋和他的年轻团队有很高的崇敬之情,为什么他们研发的模型在数学和编程方面如此先进,以至于能带动计算科学发展。
我还从中学到了一些哲学思想,比如运用时间换空间、用数量换质量。这些思想特别有意思。
我在播客还分析了:为什么打造全球共享的 AI 生态系统,对中国乃至全球都有好处,它是如何降低使用门槛、解放生产力的。
希望这期播客能够让大家从不同的视角看待DeepSeek,如果有说错的地方,也欢迎做模型的同学指正。
(播客中提到的视频:
1:科罗拉多大学的Tom Yeh教授,拿DeepSeek为例,用Excel表格讲解其原理:weibo.com
2. 哔哩哔哩:EZ encoder【EZ撸paper: DeepSeek-V3 技术报告详细解读 part1 | 开源最强模型 | 性价比之王】
欢迎大家收听,也请大家订阅“屠龙大实话”。如果大家有更想听屠龙讲的内容,欢迎留言~
时间戳
01:38 介绍DeepSeek的两个模型:V3和R1
01:52 什么是大模型?
02:44 什么是大语言模型?
03:01 什么是推理模型?
05:30 V3大语言模型的优势及对AI生态的影响
12:11 为什么屠龙觉得“世界破破烂烂,小梁缝缝补补”?
17:32 美国是怎么卡芯片出口的?
25:36小梁缝缝补补,缝补的是什么?
26:43 V3模型在计算科学方面的优势
32:29 模型里的两个哲学思想
35:17 开放模型的好处是什么?
53:30 DeepSeek团队难能可贵的地方:没有框架
55:26 AI对普通人有影响,该以什么心态面对?
62:20 下一期深入解读模型中的哲学思想
背景音乐:Hero-Family Of The Year
欢迎大家关注主播账号
微博:@屠龙的胭脂井 @思维螺旋 @百科成长课 @屠龙星球(就是主播鸡仔)
小红书:@屠龙的胭脂井 @屠龙的口袋 @屠龙职场进化论 @屠龙两性脑科学
公众号:屠龙手段 百科成长课
其他【屠龙大实话】发布平台
网易云音乐|喜马拉雅|荔枝FM | 苹果Podcast | 微博音频,全网同名。
我会在播客里给大家普及V3和R1这两个模型的概念、大模型概念,以及广义和狭义人工智能的区别。
还会谈到DeepSeek模型的特点,比如V3大语言模型优势,和它对AI生态的积极影响。
我们还讨论了,在美国限制英伟达出口的情况下,幻方量化是怎么通过GPU囤货,通过技术手段突破算力限制、增强了数学稳定性,让美国专家破防的。
我看完report之后,觉得“世界破破烂烂,小梁缝缝补补”。
我会在播客里告诉大家为什么我会这样想,为什么对梁文锋和他的年轻团队有很高的崇敬之情,为什么他们研发的模型在数学和编程方面如此先进,以至于能带动计算科学发展。
我还从中学到了一些哲学思想,比如运用时间换空间、用数量换质量。这些思想特别有意思。
我在播客还分析了:为什么打造全球共享的 AI 生态系统,对中国乃至全球都有好处,它是如何降低使用门槛、解放生产力的。
希望这期播客能够让大家从不同的视角看待DeepSeek,如果有说错的地方,也欢迎做模型的同学指正。
(播客中提到的视频:
1:科罗拉多大学的Tom Yeh教授,拿DeepSeek为例,用Excel表格讲解其原理:weibo.com
2. 哔哩哔哩:EZ encoder【EZ撸paper: DeepSeek-V3 技术报告详细解读 part1 | 开源最强模型 | 性价比之王】
欢迎大家收听,也请大家订阅“屠龙大实话”。如果大家有更想听屠龙讲的内容,欢迎留言~
时间戳
01:38 介绍DeepSeek的两个模型:V3和R1
01:52 什么是大模型?
02:44 什么是大语言模型?
03:01 什么是推理模型?
05:30 V3大语言模型的优势及对AI生态的影响
12:11 为什么屠龙觉得“世界破破烂烂,小梁缝缝补补”?
17:32 美国是怎么卡芯片出口的?
25:36小梁缝缝补补,缝补的是什么?
26:43 V3模型在计算科学方面的优势
32:29 模型里的两个哲学思想
35:17 开放模型的好处是什么?
53:30 DeepSeek团队难能可贵的地方:没有框架
55:26 AI对普通人有影响,该以什么心态面对?
62:20 下一期深入解读模型中的哲学思想
背景音乐:Hero-Family Of The Year
欢迎大家关注主播账号
微博:@屠龙的胭脂井 @思维螺旋 @百科成长课 @屠龙星球(就是主播鸡仔)
小红书:@屠龙的胭脂井 @屠龙的口袋 @屠龙职场进化论 @屠龙两性脑科学
公众号:屠龙手段 百科成长课
其他【屠龙大实话】发布平台
网易云音乐|喜马拉雅|荔枝FM | 苹果Podcast | 微博音频,全网同名。
评价...
空空如也
小宇宙热门评论...
苯环绿毛龟
5个月前
广东
39
17:30 哈哈哈哈哈,引用王骁的话:美国政府是中国科技发展的总倒逼师🤣

阮Par勇闯欧罗巴
5个月前
西班牙
36
屠龙姐姐是近一年最惊喜的发现,能把最尖端的科技讲给我这样非专业的听懂,不愧是清华+卡耐基脑机接口博士+网红👍👍👍👍👍👍
朵朵儿最棒啦
5个月前
上海
35
比一些男大佬说的通俗易懂好多!
木同1996
5个月前
上海
24
1:03:04 听的我都热泪盈眶了🥹,像姐姐说的,我们都可以站在这么好的时间节点站在Deepseek 的肩膀上,去做更多对自己对企业和社会有帮助的事
鹍鹏
5个月前
美国
19
屠龙的认知很有高度,听了后觉得很亮敞,通透!我们民族生生不息,外部压力也是一个重要的动因。这个时代其实挺好,外面总有人虎视眈眈,这也正好督促大家勤动脑筋勤动手不敢懈怠,这不正是自我提升的契机嘛。

我超级有趣
5个月前
湖北
17
45:17 想到那个中外大厨比赛,有一个环节是互相拿对方队伍的一个食材,外国队以为拿了中国队的油之后就我们就没法炒菜了,没想到中国队咔咔开始拿肥肉炼油

绿大仙儿祝您欢乐
5个月前
北京
15
世界破破烂烂,小梁缝缝补补。hhhh😆

青丘至尊宝
5个月前
湖北
13
38:44 学到了,姐姐这个思路 其实就是转念 小人就是贵人,其实就是转换自己的念头,姐姐好棒呀!又学到了,真心感谢^ω^

Myra5
5个月前
江苏
11
大家都好积极,又来跟着屠龙长见识增智慧

Monica52
5个月前
河北
8
“基础好,又懂大模型,又干到底层,又没被限制过,又想到要对全世界人民开放。”

Mr_why
5个月前
未知
8
04:48 哇开头就震撼我,我竟然从来没想过问这个问题为什么人会内耗?因为人会对自己的情感产生情感,会为自己生气而感到生气(⊙ꇴ⊙)一旦明白了真的再也不会内耗了!

绿大仙儿祝您欢乐
5个月前
北京
7
37:04 呼应了 这里也提到因为束缚带来的“好处”https://www.xiaoyuzhoufm.com/episode/67a5a1ddd74435e4a39cb17b
叁金_wgnr
5个月前
浙江
7
感谢老师 把这么多专业的东西用大家都能听得懂的话讲出来,我们也要好好学习争取站在 deepseek 这个巨人的肩膀上去拿到一些结果!
琳达_OkvW
5个月前
浙江
6
每次听完屠龙的播客都心潮澎湃的 一身牛劲🥹

英子的读书乐园
5个月前
广东
5
1:01:23 普通人应该怎么做,狠狠地用上,比昨天的自己要强一点
tutti璇
5个月前
四川
5
1:03:49 片尾区叫啥名字
Deecorpse
5个月前
意大利
4
这一期讲的真好啊,比很多博主讲得更通俗易懂,塞翁失马焉知非福,最后越讲月燃!
HD230125f
5个月前
北京
3
38:26 小人就是你最大的贵人,有些小人逼你成长
欢乐马_xssh
4个月前
北京
3
每次听完都充满力量
阿白_gD6f
5个月前
广东
0
12:01 架构开源,本地下载,输入data,token便宜