2025.02.26 | OmniAlign-V提升多模态模型对齐,SpargeAttn加速注意力计算

HuggingFace 每日AI论文速递

本期的 14 篇论文如下: [00:23] 🤖 OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference(OmniAlign-V:迈向多模态大语言模型与人类偏好增强对齐) [01:06] ⚡ SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference(SpargeAttn:准确稀疏注意力加速任意模型推理) [01:53] 🖼 KV-Edit: Training-Free Image Editing for Precise Background Preservation(KV-编辑:无需训练的图像编辑方法,实现精确背景保留) [02:32] 🌈 ART: Anonymous Region Transformer for Variable Multi-Layer Transparent Image Generation(匿名区域变换器:可变多层透明图像生成) [03:08] 🤖 SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution(SWE-RL:通过开源软件演化数据强化学习提升LLM推理能力) [03:51] 📊 Unveiling Downstream Performance Scaling of LLMs: A Clustering-Based Perspective(揭示大语言模型下游性能扩展:基于聚类的视角) [04:30] 🧠 Scale-Distribution Decoupling: Enabling Stable and Effective Training of Large Language Models(尺度分布解耦:实现大型语言模型稳定有效训练) [05:11] 🔄 K-LoRA: Unlocking Training-Free Fusion of Any Subject and Style LoRAs(K-LoRA:解锁无需训练的任意主题和风格LoRA融合) [05:51] 🌐 WebGames: Challenging General-Purpose Web-Browsing AI Agents(WebGames:挑战通用网页浏览AI代理) [06:29] 🧠 Introducing Visual Perception Token into Multimodal Large Language Model(引入视觉感知令牌的多模态大语言模型) [07:07] 🎰 The Lottery LLM Hypothesis, Rethinking What Abilities Should LLM Compression Preserve?(彩票LLM假说:重新思考LLM压缩应保留的能力) [07:47] 🧠 AAD-LLM: Neural Attention-Driven Auditory Scene Understanding(AAD-LLM:神经注意力驱动的听觉场景理解) [08:26] 🔍 LaTIM: Measuring Latent Token-to-Token Interactions in Mamba Models(LaTIM:测量Mamba模型中的潜在Token-to-Token交互) [09:07] 🧠 Shakti-VLMs: Scalable Vision-Language Models for Enterprise AI(Shakti-VLMs:企业级AI的可扩展视觉语言模型) 【关注我们】 您还可以在以下平台找到我们,获得播客内容以外更多信息 小红书: AI速递

10分钟
99+
6个月前

Vol.79 饮食,地域,学历,这世上的偏见怎么比物种还多样

保持联系|Stay Connected

Yueran在近期生活中见到了“地域偏见”对人重大决策中起到的影响,在和3201的讨论中我们发现偏见存在于生活中的方方面面,但也有许多“偏见”后面也不乏道理。本期保持联系就来和大家讨论一下,偏见到底是什么,怎么样才能尽量不让自己被偏见所困? 💬本期你将听到: 00:13 高考之重大选择,选学历还是选城市? 04:26 五十步笑百步的偏见:“外国人一定很臭吧” 08:13 简历,一个太容易把偏见落在书面上机会 10:44 各地区的“省饭”“省服”讨论,这是在强化偏见还是在文化分享? 16:49 荔枝蘸酱油,广西“酸嘢”,你别说,你还真别说 30:06 老一辈一定活在旧剧本,年轻人一定更先进?那可不一定哦 34:45 偏见给我们最大的害处,就是停止探索和沟通 38:30 "哈尔滨的机场是全世界最牛的机场",偏见使我骄傲! 46:14 “上炕”还是“喝茶” 刻板印象里也不乏文化背景哩 52:43 一个危险讨论:学历偏见到底是不是偏见?偏见的存在合理吗? 你生活中有什么偏见或被偏见的时刻吗?请在评论区和我们分享吧 💙联系我们: [email protected] 💛关于我们: 保持联系是由三位性格不同经历迥异的女主播建立的一档日常有趣故事及一丢丢思考分享播客; 希望能在各位茶余饭后拖地洗碗跑步健身时产生共鸣,有效陪伴。 💚聊天的人: 团子、Yueran、以琳 🎧收听方式: 小宇宙 | 喜马拉雅 | 网易云音乐 | Spotify | 苹果播客 你还可以在以下平台找到我们: 📕小红书/微博: 保持联系StayConnected

58分钟
99+
6个月前

73. 95后独生女:我是有点精致利己,那又怎么了?

赛博闺蜜

两个主播作为95后独生女儿,最近开始频繁发现自己身上的一些自私又自我的“独生小毛病”。但我们还是更愿意总结说,我们只是在爱中长大,有边界感,独立又自爱的个体吧! 🎺 群通告 赛博闺蜜们,我们准备开始慢慢吞吞地组建我们的听友群啦,有兴趣加入的朋友可以添加小助手微信cybersispodcast 并回复“进群” ⏰时间轴 00:55 过年为什么要强迫我去别人家过年? 04:03 不是不会照顾人,而是觉得如果我可以照顾自己,那你也可以 06:41 买房靠父母,是我错了吗? 10:00 不背房贷因为不能影响当下的生活质量 11:02 你是否也为父母养老焦虑过? 13:16 生孩子这件事完完全全是属于我个人的体验,与旁人无关 18:17 临近30岁,终于与父母和解了 🎵BGM 苏打绿《飞鱼》 📻 关于赛博闺蜜 这是一档聚焦于都市观察、亲密关系、女性成长的治愈型周更播客。 两个留美多年现居魔都的95后伪都市丽人,同是嘴比命还硬的狮子座文科女,致力于洞察和吐槽当代年轻人的都市生活,在节奏过分快的当下,用最real的声音抚平你内心的褶皱。 越长大越难交新朋友,那就让我们陪你吃饭、通勤、做家务,做你的“赛博闺蜜”吧。 👯♀️关于我们 佩佩:美食&身材是一辈子的挚友与死敌,两边都无法完全拿起,更无法完全放下,注定一生相爱相杀;最爱的食物是冰淇淋,最喜欢的饮品是酒精,热爱并痛恨着的运动是跑步,最享受的事是就是躺在夏天的空调房里用勺子放肆地挖西瓜吃。 Wendy:住过芝加哥、纽约、北京、上海,学过新闻、心理、营销传播,混过时尚、互联网、教育圈,但最想当的还是小说家和心理咨询师(有钱版)。总是容易爱的太多,因此总有一个无法解决的困惑:人为什么不能同时居住在两个城市,过两种人生?

26分钟
99+
6个月前

123.嗑学研究: 同人二创亚文化.....嗑CP的门道有多深!

宇宙尽头小酒馆

《哪吒2》的火从春节档烧到现在,藕饼cp又成了热门产品, 一时间同人文多到看不完,同人图多到刷不完。 正当同人女们躺在大烫圈里吃粮之时, 一些关于同人的争议,也随之吵上热搜, 不同圈层的碰撞,让原本小众的同人文化争议频出。 那么,我们今天就来主观的、简单的、不全面的浅聊一下, 搞CP这件事儿,门道有多深! —— ⚠️预警:本期主打流行文化观察, 会聊到同人文化,同人创作,嗑cp等, 有很多个人趣味分享和各种大放厥词,纯主观!不吵架!快乐嗑cp! 直男朋友慎入! 如果你不搞cp,但对同人亚文化感到好奇,也可以来听! —————— 本期嘉宾 @门童 - 播客「严肃喧哗」「过期少女」主播 本期主播 @蛋黄酱 - 正在偷懒的互联网搬砖工,业余影迷 @梁梁 - 新手数字游民、擅长打杂 —————— 时间轴 01:54 我们嗑过的cp有哪些:Killing Eve、藕饼、福华...... 10:18 原创和同人有啥区别? 15:29 女频、男频怎么归类?女频=言情吗? 19:57 AO3 代表了一种同人文化的开源精神 23:55 嗑cp名词辨析:啥叫产品/公公/嬷嬷/泥塑/正塑/ABO 28:07 世界腐女嗑cp:泰国日韩欧美在嗑啥 34:26 嗑CP为啥上头?角色的魅力在于同人女的想象力 55:06 磕CP有助于女性叙事的空间探索吗? 58:31 从《文本盗猎者》来聊聊同人文化 01:10:00 用同人解构刻板性别气质 01:11:40 BL同人存在厌女现象吗? 01:13:55 从某言情作者翻车事件,观察同人生态变化 01:19:01 大环境的厌女与个体的复杂 —— 本期提及: 🎬影视剧:《去唱卡拉OK吗?》《杀死伊芙》《哪吒之魔童闹海》《神探夏洛克》《雍正王朝》《黑执事》《灌篮高手》《邪恶力量》《善意的竞争》《小姐》《孤单又灿烂的神:鬼怪》《莲花楼》《火影忍者》《叛逆的鲁鲁修》《百变小樱》《射雕英雄传侠之大者》 📖小说:《盗墓笔记》《她对此感到厌烦》《我在废土世界扫垃圾》 ✍️作者:徐磊 水千丞 淮上 匪我思存 —————— 关于我们 两个女生的都市闲聊/影视漫谈/生活方式讨论 常驻上海 主理人 @蛋黄酱 - 正在偷懒的互联网搬砖工,业余影迷(小红书@蛋黄酱酱酱) @梁梁 - 新手数字游民、擅长打杂(小红书@梁梁喝茶不加糖) 找到我们 邮箱:[email protected] 公号:宇宙尽头小酒馆,梁梁喝茶不加糖 weibo:@宇宙尽头小酒馆

100分钟
13k+
6个月前

Vol.264 | 世界对中国经济与科技认知,正在转变

第一财经

中国叙事正在变。就在半年前,投行关于中国经济的最流行话语还是“资产负债表衰退”,将中国的未来类比于日本资产泡沫破裂后失去的几十年。如今外资投行的研报,突然间一边倒地看多。比如德意志银行的研报是《中国吃掉全球:中国的“斯普特尼克时刻”》,报告认为,2025年是中国超越其他国家的一年,代表事件是全球首款第六代战斗机的试飞和低成本人工智能系统DeepSeek;高盛的研报是《启航2025:在中国股市中斩获超额收益》,报告提出2025年要超配A股和港股,预计MSCI中国和沪深300指数全年上涨20%。 本期我们将跟随一财号专家,人文财经观察家秦朔,来看看当前外资投行如何看待中国的?有什么样的转变?这些转变的背后都有哪些的中国力量?还有哪些思考?对DeepSeek和哪吒2所带来的全球影响力,你有什么感受?欢迎在评论区留言。 本期,你将听到以下内容: 00:49中国叙事正在变:“一边倒”地看多 02:56美国“科技七巨头”跑输中国“科技十姐妹”? 04:14中国药企走在研发前沿 05:31电动汽车之后,日本在新赛道上又输中国了? 06:41DeepSeek+哪吒2,中国叙事转变的力量 07:29梁文锋、饺子这样说…… 08:21从“行行都在卷”到“行行都可闯” 09:07中国产业的进步,离不开有为政府 10:44中国力量:国民共进 11:23要有客观冷静之心,正视短板 13:11中美之争:我不乱,他自乱 13:55“思想”“心态”上做好引领的准备 15:19原创性、主体性的觉醒,有助于我们看得更远 文字作者:秦朔 人文财经观察家 播客编辑:派ris 嘴不瓢的李同学 监制:yoiyo 这是一档由第一财经推出的播客节目,专注解读热点商业资讯、财经事件,分析背后逻辑,提供干货,在这里,你可以听点你想听的。 如果喜欢我们的节目,欢迎转发分享~

16分钟
5k+
6个月前

Vol.197 美国不降息,让日本人吃不起大米?

商业就是这样

本期节目的标题,来自于我们在社交网络上看到一条非常神奇的新闻,总结而言就是这样一句话:日本最近米价暴涨,是因为日本农林中央金库投资美债巨亏,而巨亏的原因是美国不降息。 如果这个故事成立,那会是一个非常有趣的宏观货币政策影响日常生活的案例。但它真的成立吗?本期节目,我们探究了这个问题的答案,顺带还窥探了日本独特的农业政策。 《商业就是这样》200期特别节目听友问答征集开始啦! 无论是对节目本身的好奇,还是关于商业话题的问题,都欢迎告诉我们。我们会选一些话题,认真准备,在节目上回答。除了文字形式以外,这次我们还想要征集大家的声音!欢迎你把对节目的好奇和感谢录成音频发给我们,你的声音也有机会出现在《商业就是这样》。 参与方式1:扫描下方二维码填写问卷 参与方式2:点击本链接在页面中找到问卷。 发送音频的三种方式: 1 在问卷中提交音频,建议使用手机自带的录音功能上传音频,在安静环境下录音; 2 发送音频到邮箱[email protected](请标注:200期听友留言+昵称) 3 发送音频文件至【商业就是这样】微信号,建议使用手机自带的录音功能,在安静环境下录音(请不要使用微信语音功能)。 问卷收集截止至3月6日,我们会选取大家最关心的问题上节目。 为了感谢各位参与者,我们还会抽出10位幸运听友,送出同名书籍出版物《商业就是这样》的主播to签! 那么,200期见! | 主播 | 肖文杰、约小亚 | 时间轴 | 04:25 农协是一个什么样的“存在”? 08:53 农林中央金库的特殊资产结构 12:25 “出海”是农林中央金库维持盈利能力的策略 13:59 为什么利率上升、债券价格会下降? 16:33 单赌一边,放大了风险 19:07 日本此次大米上涨的表面原因 22:08 “流通堵塞”到底堵在哪儿 25:33 为什么日本政府要让大米减产 33:09 一个很满的浴缸,伸进去半只脚 33:26 所以,标题的逻辑成立吗? | 延伸资料 | 招商银行研究院 - “出海”浮沉三十年:日本农林中金银行大额预亏探究 日本米价上涨的原因和储备粮制度 日本为什么减产大米 农林水产省大米政策导致的结果 minorasu - 令和米骚动和农家的未来 Vol.42 看,这是国家为你囤的货 《商业就是这样》鼓起勇气开设听友群啦。欢迎添加节目同名微信,加入听友群,一起讨论有意思的商业现象。微信号:thatisbiz 为了营造更好的讨论环境,我们准备了两个小问题,请在添加微信后回答: 1,你最喜欢《商业就是这样》的哪期节目?为什么? 2,你希望听到《商业就是这样》聊哪个话题? 期待与你交流! | 后期制作 | 潘鑫 | 声音设计 | 刘三菜 | 收听方式 | 你可以通过小宇宙、苹果播客、Spotify、喜马拉雅、网易云音乐、QQ 音乐、荔枝、豆瓣等平台收听节目。 | 认识我们 | 微信公众号:第一财经 YiMagazine 联系我们:[email protected]

37分钟
53k+
6个月前

布蕾克|DeepSeek 或提前发布新模型,香港迪士尼时隔 10 年首次盈利

声动早咖啡

本期节目由 Cafebreak 布蕾克咖啡冠名播出。 本期早咖啡为你带来与日常生活息息相关的商业科技动态,你将会听到: * 阿里宣布投资 3800 亿建设云和 AI 基础设施 * 拼多多组建大模型团队 * 特斯拉市值跌破万亿美元 * Adobe 推出新版 Photoshop 手机应用程序 本期还有关于 DeepSeek、星巴克、香港迪士尼、理想和麦当劳的新动态,欢迎收听! 布蕾克黄金甜黑巧由布蕾克 Cafebreak 与 2024 年 WBC 世界咖啡师大赛世界冠军 Mikael 共同研发升级,为家庭用户带来更高品质、更大甜感的意式咖啡体验。 现登陆布蕾克天猫旗舰店:sourl.cn,报暗号【声动早咖啡】,可领取 20 元现金券,全场任意消费 159 元即可使用,成为布蕾克会员,更可获得多重咖啡福利及活动信息。 Cafebreak 布蕾克咖啡秉承「美好咖啡生活」的品牌理念,甄选埃塞、哥伦比亚、巴拿马、巴西、云南等世界优质咖啡豆,由 Q-grader 和国际烘焙师团队,联合打造质优价优的咖啡产品,以美洲热带地区绚丽的金刚鹦鹉为品牌 IP,为家庭消费者传递咖啡的美好风味及乐活态度。 同时,世界冠军 Mikael 也为黄金甜黑巧拿铁定制了萃取参数,可供参考: 主播 Mengyi 幕后制作 监制:Zelin、Qianwen、Stella 实习研究员:佳麒、小君、迪卡、楚欣 运营:George 后期:沁茗 商业内容策划:Nene 商业项目管理:Jolin 封面设计:饭团 商务合作:声动早咖啡等节目商业合作持续招募中,点击链接直达 声动商务会客厅,或者发送邮件至 [email protected] 联系我们; 加入我们:声动活泼正在寻找商业化合作经理、播客节目监制的全职伙伴,以及早咖啡内容实习生,详情点击招聘入口; 听众投稿:如果你了解身边日常现象的背后原因,欢迎投稿,你的发现可能出现在节目中; 成为会员:如果你在节目中有所收获,认可好内容的价值,欢迎付费 365 元成为会员,你可以免费收听声动活泼付费内容,同时每周获得一封节目外的观察手记。 「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。 * 我们还有这些播客:声东击西、What's Next|科技早知道、商业WHY酱、跳进兔子洞&跳进兔子洞第三季(全新发布)、吃喝玩乐了不起、不止金钱、泡腾 VC、反潮流俱乐部 * 如果你喜欢我们的节目,欢迎打赏支持,或把我们的节目推荐给朋友

12分钟
12w+
6个月前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧