Album
时长:
12分钟
播放:
141
发布:
5个月前
主播...
简介...
https://xiaoyuzhoufm.com

“务必要疯狂地怀抱雄心,且还要疯狂地真诚”——梁文峰


“真正的差距不是一年或两年,而是原创和模仿之差”——梁文峰


“一定有办法对价格建模”——詹姆斯·西蒙斯(James Simons)


从金融炼金术到AGI圣杯,85后梁文锋用7个月打造出月活破亿的DeepSeek,其公司开源模型DeepSeek-R1被西方媒体称为"人工智能的斯普特尼克时刻"。在硅谷,DeepSeek被称作“来自东方的神秘力量”,因为它的若干独到之处:-不烧钱补贴而是有利润的运营模式/创始人量化投资而非科技的行业背景/创始人梁文峰几乎很少出现在公众视野中。2024年7月梁文峰曾接受媒体采访,阐明了其创立和经营Deepseek的若干关键问题。


引发价格战的起因及其看法:详细阐述DeepSeek V2如何通过史无前例的性价比(每百万token仅1块钱)引发价格战,梁文锋对此感到意外,并认为大厂的跟进是互联网时代的烧钱补贴逻辑。同时,DeepSeek降价的主要目的并非抢用户,而是因为成本先降下来了,并且认为AI应该是普惠的。


技术创新与架构层面的突破:详细介绍DeepSeek V2采用的MLA架构(显著降低显存占用)和DeepSeekMoESparse结构(极致降低计算量),这些创新促成了成本的下降。强调这种架构创新在国产大模型公司乃至全球开源基座大模型中都属罕见,并且Attention架构多年未被成功修改,DeepSeek是“逆行者”。讨论中国公司之前为何很少涉足架构创新(成见、不划算)。


•DeepSeek的独特道路与理念:它是中国7家大模型创业公司中唯一一家放弃“既要又要”路线,只专注研究和技术、未做toC应用的公司。也是唯一未全面考虑商业化、坚定选择开源且未融过资的公司。这种选择基于认为最重要的是参与全球创新浪潮,以及认为中国不应一直搭便车,也应成为技术贡献者。讨论原创和模仿的差距是真正的差距。


•开源与护城河:阐述在颠覆性技术面前,闭源的护城河是短暂的。DeepSeek把价值沉淀在团队成长、积累Know-how、形成创新组织和文化上,这是他们的护城河。开源是一种文化行为,给予是一种额外的荣誉,有文化的吸引力。他们不会闭源。


人才与组织文化:梁文锋认为并没有奇才,都是本土的年轻人。他们不执着于海外挖人,希望自己打造人才。MLA创新的Idea来自年轻研究员的个人兴趣。DeepSeek的组织方式是自下而上、自然分工,不前置分工,通过热爱和好奇心筛选人才。对卡和人的调集非常灵活,每个人调用训练集群的卡无需审批,可灵活调用所有人。


对中国AI、AGI及产业未来的看法:认为中国AI不可能永远处在跟随位置。中国创新不缺资本,缺的是信心和组织高密度人才有效创新的能力。创新需要好奇心和创造欲。认为Scaling Law符合预期,AGI可能会在2-10年内实现。押注数学和代码、多模态、自然语言本身这三个AGI方向。认为未来的大模型产业将是基础模型公司和应用公司专业分工的格局。中国的产业结构调整将更依赖硬核技术创新,未来硬核创新会越来越多。


如果希望和主播建立联系/加入听友群,可加微信bonewe2004!


关于主播:


评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧