Album
时长:
74分钟
播放:
2,412
发布:
8个月前
简介...
https://xiaoyuzhoufm.com

本期对话:


频道主理人:韭菜核子、北漂民工


嘉宾:


1.山羊:跨国科技公司的应用科学家,从事AI领域的研究和工作有十余年


2.橙橙:投资机构的投资经理,跟踪聚焦科技板块



本期分别从投资视角,以及技术视角,分别对DeepSeek这一轮热潮的进行复盘,并探讨对上下游各类产业趋势的影响,以及技术上可能的趋势,以及AI使用者如何更好的运用相关工具,改善自身工作流。



00:00 开场白,解读春节前后由DeepSeek引发的AI热潮 


02:09 事件复盘:2023年年中,专注量化的团队突然宣布参与AI大模型竞赛→2024年年中诞生扎实的产品原型V2→2024元旦热度最高的V3→一部分人认为是不错的产品,但始料未及,仅20天后热潮出口转内销对中美股市和币圈产生巨大影响。


07:27 技术领域被广泛关注到也在1月下旬,性能接近于OpenAIo1版本,成本只有1/30左右令人震惊,并不同AI模型的区别和应用场景,包括通用大模型和垂类模型,以及多模态大模型的特点


11:45 各类大模型和DeepSeek的比较:在C端运用的过程中,没有因为成本平衡削弱体验


16:32 AI基础模型公司与上下游投资前景的转变:期待已久的AI应用仍未创造出全新的场景或用途,包括程序写作领域,中国的场景与美国场景完全不同,其他大模型并未形成一个杀手级应用,买量依赖、用户留存都不尽如人意,但Deepseek打破,产品足够好,是无需买量的。


20:04 技术突破点和创新点简析:成本、开源性、底层硬件交互优化,技术报告详细介绍了数据准备、训练过程及消融实验,更重要的是,通过强化学习达到与人类专家相当的推理水平,无需人为干预。


24:10 强化学习:从2013年的打砖块、AlphaGo下围棋,到GPT3.5后展示的非常领先的推理能力,但GPT并不开源,DeepSeek的强化学习方法兼顾了开源、优雅、高效


28:25 DeepSeek模型对开源社区的影响:告诉大家一个顶级的推理模型如何实现,技术文档看出,反直觉的比喻是,可以通过提高模型的数学能力推理能力,进一步提高脱口秀能力和写作能力。开源社区和团队会紧跟着验证过的方法紧锣密鼓复现,


33:26 DeepSeek可能是具备比llama更重要的地位,后者模型参数过多,小公司难以参与,而deepseek授人以渔,即便是你是一个小尺寸模型,上了强化学习,推理能力都会迅速提高。


36:34开源的战争: 一种下位对行业龙头残忍的进攻手段,开源社区提供了一种持续紧张的压力感,闭源如果没有开源做的好,那就没必要存在了。


40:28 DeepSeek为何没有诞生在互联网大厂而是在量化私募?人才储备,语料没有优势吗?可能这些并不是优势,语料+用户+平台,这种滚雪球效应,所谓的技术飞轮效应,在大模型领域可能不重要。


42:47 “伟大是不能够被计划的”:无论是GPT诞生前、还是在DeepSeek诞生前,大家都没有预料到这样的创新方向,在不为人知的创新领域,无论是智力资源还是知识资源,都没有被大厂垄断,反而创新的人才们往往来源于不算业务核心部门的边缘部门,人生经历非常曲折。


45:13 语料的规模不如语料的质量,你想让大模型变得聪明,不要让他看一些特别烂的语料,应该去多看代码库,比如github,代码能力提高模型的推理能力,还会提高文学的创造力。


46:46 为何诞生在二级市场量化公司?事后分析量化公司的优势:万卡集群门票,量化团队的业务需求就有比较懂硬件、通信的团队,比如FPGA,互联网公司的算法人员数量和人才密度较高,但自己不做硬件,量化公司反而有一定优势。


49:06大模型语料污染问题何解:为何中国最好的基金经理和最差的基金经理,在大模型眼里可能是一波基金经理?可能来源于品牌部门的语料污染。最好是先让给模型罗列一个推理任务,然后做一些检索和分析,提高工作效果。 一些防伪、水印技术可以限制,但是很难完全避免。


53:41 除了算力以外,人才来源和组织方式有何异同?DeepSeek招聘对优秀的人才、优秀的应届生有很强的吸引力,调用算力权限大、可以不管产出、允许失败,相比中国的互联网大厂,人才组织是高周转、双月OKR、两个周期看不到效果团队解散,在资源投入卷翻天,但创意性项目建树乏味。


58:46科技竞争回到古典的天才决定论,优秀的年轻应届生、天才员工,天然不适应资源投入+行军打仗模式的公司组织模式。


1:01:26 AI相关产业链投资逻辑变化:硬件投入仍然十分重要,但紧迫性在未来24个月是否更高可能要打问号;对GPU深度优化的方向提到日程,这对相关公司估值短期影响较大;openai和anthropic由于技术的领先型和稀缺性,给了较高的估值,但如果后续看到欧洲的竞争者、印度的竞争者,这种稀缺性是否能持续?


1:08:33 AI技术的未来展望:自动化流程提高编程效率,以及强大推理模型在减少错误和增强agent决策能力方面的作用。展望未来,AI可能在工业生产和服务业中扮演重要角色,实现具身智能控制。从投资角度看,AI领域的投资逻辑可能从硬件竞争转向软件和应用层面,不要参与错。


以上内容仅为个人观点,不作为任何投资建议。





 



 

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧