HuggingFace 每日AI论文速递 - 2024.10.01 每日AI论文 | 多模态模型提升图像理解，长度控制方法增强生成精确性。 - EarsOnMe

HuggingFace 每日AI论文速递
2024.10.01 每日AI论文 | 多模态模型提升图像理解，长度控制方法增强生成精确性。

时长：

7分钟

播放：

发布：

11个月前

主播...

拨号上网

简介...

本期的 11 篇论文如下：

[00:26] 🌐 MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-tuning（MM1.5：多模态大语言模型微调的方法、分析与见解）

[01:04] 📏 Ruler: A Model-Agnostic Method to Control Generated Length for Large Language Models（Ruler：一种用于控制大型语言模型生成长度的模型无关方法）

[01:41] 🗣 DiaSynth -- Synthetic Dialogue Generation Framework（DiaSynth -- 合成对话生成框架）

[02:22] 📊 Hyper-Connections（OLMo-1B：探索DHC和SHC中的规模与训练）

[02:57] 🤖 UniAff: A Unified Representation of Affordances for Tool Usage and Articulation with Vision-Language Models（UniAff：一种结合视觉语言模型的工具使用和关节运动的统一表示方法）

[03:35] 🔍 Cottention: Linear Transformers With Cosine Attention（Cottention：基于余弦注意力的线性变换器）

[04:10] 🤖 Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers（通过异构预训练Transformer扩展本体感觉-视觉学习）

[04:49] 🏋 Coffee-Gym: An Environment for Evaluating and Improving Natural Language Feedback on Erroneous Code（咖啡健身房：评估和改进错误代码的自然语言反馈环境）

[05:29] 🖼 Image Copy Detection for Diffusion Models（扩散模型图像复制检测）

[06:09] 🧠 Can Models Learn Skill Composition from Examples?（模型能否从示例中学习技能组合？）

[06:43] 🎧 IDEAW: Robust Neural Audio Watermarking with Invertible Dual-Embedding（IDEAW：具有可逆双嵌入的鲁棒神经音频水印）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

去听...

小宇宙

谁收藏了...

EarsOnMe

空空如也

加入我们的 Discord

扫描微信二维码

播放列表