AI前沿:从数学推理到模型优化
AI可可AI生活

AI前沿:从数学推理到模型优化

7分钟 68 8个月前
节目简介
来源:小宇宙

[CL] OctoThinker: Mid-training Incentivizes Reinforcement Learning Scaling


[Shanghai Jiao Tong University]


https://arxiv.org/abs/2506.20512


---


[LG] Overtuning in Hyperparameter Optimization


[LMU Munich]


https://arxiv.org/abs/2506.19540


---


[LG] Distilling Normalizing Flows


[University of Oregon & HSE University & Picsart AI Research]


https://arxiv.org/abs/2506.21003


---


[LG] Gaussian Invariant Markov Chain Monte Carlo


[Google DeepMind & UCL]


https://arxiv.org/abs/2506.21511

评价

空空如也

小宇宙热评

暂无小宇宙热门评论

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧