DeepSeek R1昨天更新后,没有技术报告。 可能因为都是网友测评和猜测比较多,DeepSeek官方公众号在5月29日晚发布了一篇文章,比较详细地解释了更新点。 题目是《DeepSeek R1更新,思考更深,推理更强》。比较有信息量,就聊聊这篇吧~ 原文链接:mp.weixin.qq.com
DeepSeek低调更新了新版R1,路上听听网友们的评测效果。 由David的虚拟小伙伴Tony(小智)和Lily(小华)录制~
今天凌晨Anthropic发布了最强编程模型Claude4,路上听听都有啥。 原文链接:https://www.anthropic.com/news/claude-4 由David的虚拟小伙伴Tony(小王)和Lily(小李)录制~ SWE的分数:
由David的虚拟小伙伴Tony和Lily录制:)
hi,《AI全景图》的听众朋友们,我是David,最近在做一些好玩的声音实验,希望尽量有点趣,还有点用。 这是大概两年前写的《AI大模型暴论》的1-4篇,今天在播客分享一下~ 00:20 机器翻译就是大模型的前车之鉴 02:07 行业大模型是否是一个伪命题? 03:31 如何看待国产大模型既卷模型,又卷上层应用? 06:12 大模型意味着脑力劳动时代的终结 这就是AI大模型暴论播客的第一期,希望你有一点点收获。 如果你有感兴趣的内容,吐槽或者建议,都欢迎给我留言呀!
说明:之前发在公众号的这篇比较长,用相对轻松的播客形式再听一遍。由David的虚拟小伙伴Tony和Lily录制:) 作者介绍:姚顺雨,OpenAI研究员,思维树(Tree of Thoughts)作者。原题目为《AI的下半场》(The Second Half) 摘要:我们正站在AI发展的中场分界线上。但现在(2025年4月)发生了什么质变呢? 简而言之:强化学习(RL)终于奏效了。更准确地说:强化学习终于通用化了。 经过数次重大探索与里程碑的积累,我们已掌握一套通用配方,能通过语言与推理解决广泛的RL任务。哪怕在一年前,如果你告诉AI研究者"同一套方法能处理软件工程、创意写作、国际数学奥林匹克竞赛级数学、键鼠操作和长文本问答",他们只会嘲笑你在妄想——其中任何一项都足以让学者耗费整个博士生涯。 但奇迹已然发生。 那么接下来会怎样?AI的下半场——始于此刻——将把焦点从"解决问题"转向"定义问题"。新时代的胜负手不再是训练能力,而是评估体系。我们不再只问"能否训练模型解决X?",更要追问"该让AI解决什么?如何衡量实质进步?"要在这场新竞赛中胜出,我们需要思维和技能的转型——或许更接近产品经理的视角。
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧