Album
时长:
14分钟
播放:
269
发布:
4个月前
主播...
简介...
https://xiaoyuzhoufm.com

最近SemiAnalysis发布的一篇硬核技术博客,似乎掀开了OpenAI秘密训练的新模型的面纱。在这篇文章里,不仅提到了OpenAI正在研发一个介于GPT-4.1和GPT-4.5之间的全新模型,更是指出下一代推理模型o4的训练策略,发生了重大转变,而背后的核心驱动力,正是近年来备受关注的强化学习技术。今天大飞就来给大家解读一下文章,看看强化学习究竟正在如何改写大模型的研发范式,以及AI领域又将经历怎样的技术变革。



https://semianalysis.com/2025/06/08/scaling-reinforcement-learning-environments-reward-hacking-agents-scaling-data/#tool-use-and-o3



聊天讨论群,微信群二维码(如果进不了,看频道首页,可加个人微信gxjdian入群)


评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧