Album
时长:
4分钟
播放:
146
发布:
5个月前
主播...
简介...
https://xiaoyuzhoufm.com

本期精华汇总



  • [LG] Implicit Search via Discrete Diffusion: A Study on Chess隐式搜索通过离散扩散:关于棋类的探讨通过“隐形思考”技术,AI在国际象棋中实现高效决策,未来可用于更多规划任务。

  • [IR] Granite Embedding Models[IR]花岗岩嵌入模型IBM开源的高效搜索模型,支持多语言,助力企业优化检索体验。

  • [LG] Teasing Apart Architecture and Initial Weights as Sources of Inductive Bias in Neural Networks将架构和初始权重作为神经网络的归纳偏置来源分开探讨初始权重优化能缩小网络差距,但结构对新任务的适应性仍关键。

  • [CL] Distill Not Only Data but Also Rewards: Can Smaller Language Models Surpass Larger Ones?[CL] 不仅蒸馏数据,还要蒸馏奖励:小型语言模型能否超越大型模型?小模型学习大模型的判断力,在数学等任务上实现超越。

  • [CL] Thinking Slow, Fast: Scaling Inference Compute with Distilled Reasoners[CL] 慢思考,快思考:通过蒸馏推理者扩展推理计算快模型用速度换性能,在资源受限场景下表现更优。


完整推介:https://mp.weixin.qq.com/s/cjsoI1nN_zLS370bFQq8vw

评价...

空空如也

小宇宙热门评论...
郭E
5个月前 上海
0
很有帮助
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧