节目列表: AIContext | AI每日新闻 - EarsOnMe | 发现和收听来自小宇宙的热门播客

5个月前

2024.10.26 | AI 新闻速递

🗣️ 智谱清言推出情感语音通话功能，国产AI技术再创新高智谱清言宣布其情感语音通话功能全面上线，并开源了情感语音模型GLM-4-Voice，标志着国产AI技术在多模态交互和自主智能体方面的重大进步。 🌐 华为与伦敦大学学院合作推出LiMAC架构，AI操作手机更智能华为与伦敦大学学院合作推出的LiMAC架构，使AI能够像人类一样操作手机，显著缩短执行时间至平均每个任务只需3秒，性能超越了基于GPT-4的基线。 🤖 稚晖君开源智元机器人灵犀X1，推动国内机器人技术进步稚晖君在1024程序员节上宣布开源智元机器人灵犀X1的全套图纸和代码，提供了详细的硬件和软件资源，被视为国内机器人开源界的重要里程碑。 🔬 ICML 2024新算法TDPO-R，提升扩散模型生成效率武汉大学等机构的研究人员在ICML 2024上提出TDPO-R算法，通过引入时间差分奖励机制，有效缓解了扩散模型对齐时的奖励过优化问题，有望推动生成模型的发展。 🦾 波兰公司Clone Robotics发布仿生机器人Torso，灵感来自《西部世界》波兰机器人公司Clone Robotics发布的仿生机器人Torso，采用“人造肌肉”驱动，模仿人类肌肉骨骼结构，能够进行复杂动作，团队已筹集64万美元资金推进技术发展。 📚 arXiv与Hugging Face合作，简化研究资源获取流程 arXiv与Hugging Face合作推出新功能，用户点击按钮即可直接访问相关论文、模型和数据集，极大提升了研究的便捷性。 🧪 康奈尔大学开发LLM-EO算法，提升化学空间探索效率深度原理与康奈尔大学的研究团队开发了LLM-EO算法，利用大型语言模型显著提高了化学空间探索的效率，该研究已发布在预印平台arXiv上。

5个月前

2024.10.25 | AI 新闻速递

🚶‍♂️ OpenAI高层变动：Miles Brundage离职投身AI政策研究 OpenAI资深研究者和管理者Miles Brundage宣布离职，计划创立或加入非营利机构，专注于AI政策研究和倡导。 🔍 AI透明化新工具：Transluce发布Monitor界面 AI研究实验室Transluce发布Monitor工具，帮助研究者直观观察和分析大模型的内部计算过程。 🛠️ 英伟达Blackwell芯片修复完成：2025年初量产英伟达CEO黄仁勋确认Blackwell AI芯片设计缺陷已修复，预计2025年初开始发货。 🔒 谷歌开源SynthID-Text：提高LLM生成文本识别度谷歌DeepMind开发的SynthID-Text技术已开源，能够为大型语言模型生成的文本添加水印。 🏆 OPPO Hammer-7B模型评测夺冠：工具调用表现卓越 OPPO研究院与上海交通大学合作开发的Hammer-7B模型在工具调用评测中表现突出，综合排名第一。 🧠 多校联合推出DuoAttention框架：提升长上下文推理效率 MIT韩松团队与多所高校联合推出DuoAttention框架，大幅提升长上下文推理效率。

3分钟

2024.10.24 | AI 新闻速递

🖥️ Claude 3.5 Sonnet升级：AI与计算机交互新突破 Anthropic推出Claude 3.5 Sonnet和Claude 3.5 Haiku模型升级，提升AI与计算机软件交互能力，开启新的应用可能性 🧠 WISE方法：解决大模型知识记忆编辑中的幻觉问题浙江大学团队提出WISE方法，通过双重记忆机制精确控制和更新大语言模型知识，提升模型可靠性和泛化能力。 🤖 OKAMI方法：机器人通过视频学习人类操作德克萨斯大学奥斯汀分校与NVIDIA Research团队开发OKAMI方法，使机器人能够通过观看视频学习并模仿人类操作任务。 🐜 MODEL SWARMS算法：群体智能优化大型语言模型谷歌与华盛顿大学研究团队提出MODEL SWARMS算法，借鉴群体智能行为优化LLM，提升模型适应性和效率。 🧪 Prompt-MolOpt工具：提升分子优化效率浙江大学、中南大学与碳硅智慧团队联合开发Prompt-MolOpt工具，利用Prompt嵌入技术显著提升分子优化效率。 🎨 Ideogram Canvas：AI画板工具引领创意新潮流 Ideogram推出AI画板工具Canvas，凭借魔法填充和无限扩图功能，迅速获得用户好评。 🌊 OceanBase 4.3.3GA版本：AI与数据库深度融合 OceanBase发布4.3.3GA版本，深度融合AI与数据库处理能力，支持多模态数据融合查询，提升AI应用构建效率。 🎥 Genmo Mochi 1：开源视频生成模型引领新纪元 AI视频生成公司Genmo发布目前最大的开源视频生成模型Mochi 1，专为高保真运动和提示遵循能力设计。

2024.10.23 | AI 新闻速递

🌟 星绽OS开源：中国科技巨头联手打造安全系统软件新纪元中关村实验室、蚂蚁集团、北京大学等机构联合发布开源系统软件栈“星绽”，面向全球开发者开放，提升系统软件安全性。 🔬 Meta发布OMat24：AI加速材料科学革命 Meta公司推出“Open Materials 2024”数据集和预训练模型，通过AI技术推动材料科学发展，成为该领域最大公开数据集之一。 🤖 AI价值观对齐：超越人类偏好的新思路麻省理工学院等研究团队探讨AI与人类价值观对齐难题，提出超越偏好聚合，直接对齐“优秀助手”等规范性目标。 🔍 合合信息图像篡改检测：守护数字内容安全合合信息在智能图像处理领域取得新进展，开发图像篡改检测技术，有效识别图片造假，广泛应用于金融、保险等行业。 📱 骁龙8至尊版发布：开启终端侧生成式AI新时代高通发布全新一代旗舰移动平台骁龙8至尊版，性能和能效显著提升，小米15系列将首发搭载，各大手机厂商即将跟进。 ♟️ DeepMind国际象棋AI争议：推理能力成焦点 DeepMind论文引发AI推理能力争议，Meta FAIR研究科学家质疑评估方法，凸显AI在复杂任务中推理能力评估难题。 🌐 DeepSeek发布Janus：多模态统一模型新突破 DeepSeek推出Janus模型，通过解耦视觉编码统一多模态任务，显著提升模型灵活性，成为多模态通用模型的有力候选。 🏆 Maitrix.org发布Decentralized Arena：AI评估新基准 Maitrix.org推出基于大语言模型群体智能的多维评估基准，通过去中心化系统避免评估偏见，提供透明可复现的评估结果。

5分钟

2024.10.22 | AI 新闻速递

🌟 AI加速核聚变研究：预测速度提升1000万倍美国能源部普林斯顿等离子体物理实验室开发的新型AI模型，在等离子体加热预测中实现了前所未有的速度提升，为核聚变能源的探索开辟了新道路。 💡 OpenAI影响力再放大：黄仁勋谈AI工程速度英伟达CEO黄仁勋强调OpenAI在AI领域的重要性，并指出AI工程实施速度的惊人进步，如马斯克在19天内完成超级计算机集群建设。 🍎 苹果AI落后两年？内部员工揭露生成式AI差距苹果内部员工透露，公司在生成式AI技术方面落后行业领先公司两年以上，计划在2026年全面集成AI能力。 🌐 智源发布Emu3：原生多模态世界模型引爆AI社区智源研究院发布的Emu3模型，通过预测下一个token实现文本、图像、视频的多模态理解和生成，被视为多模态AI领域的重大突破。 📹 LLaVA-Video-178K：合成数据集助力视频多模态模型发展字节跳动等机构合作开发的高质量合成数据集LLaVA-Video-178K，显著提升了视频多模态大模型的理解能力，推动AI技术进步。 🧠 Mamba推理能力受限：Transformer仍占优势北京大学和清华大学的研究揭示了Mamba等高效模型在推理能力上的局限性，提出通过增强局部性和引入上下文检索器来提升其能力。

2024.10.21 | AI 新闻速递

🔍 Meta发布AI新工具：推动高级机器智能发展 Meta公司最新发布的SAM 2.1、Spirit LM、Layer Skip和Lingua等AI工具，旨在推动高级机器智能（AMI）的发展，进一步推动AI领域的开源研究和应用。 💰 OpenAI与微软股权争夺战升级：资金与独立性成焦点 OpenAI与微软因资金和独立性问题出现裂痕，微软寻求以140亿美元投资换取大量股权，OpenAI则争取更好的合同以推动AI大模型研发。 🧠 MoEUT：混合专家架构提升Universal Transformer效率 Jürgen Schmidhuber和Christopher Manning团队提出的Mixture-of-Experts Universal Transformers（MoEUT），通过优化共享层MoE架构，显著提升计算和内存效率，超越标准Transformer。 ⚡ SageAttention：8比特量化Attention算法实现推理加速清华大学陈键飞团队提出的SageAttention算法，实现了对FlashAttention2和xformers的两倍及2.7倍的推理加速，且在视频、图像、文本生成等大模型上未出现精度损失。

2分钟

2024.10.20 | AI 新闻速递

🧬 蛋白质预测新纪元：双模型自适应权重融合网络引领生物信息学革命东北大学研究团队开发的TAWFN框架，结合CNN和GCN，显著提升蛋白质功能预测的准确性，为生物信息学领域带来重大突破。 💡 AI推理速度飞跃：SambaNova RDU芯片挑战英伟达GPU霸主地位随着OpenAI的o1发布，SambaNova的RDU芯片在推理性能上超越传统GPU，成为AI芯片市场的新竞争者。 🎓 学术界新星加盟：刘壮教授将引领普林斯顿大学AI研究新方向深度学习领域知名学者刘壮即将加盟普林斯顿大学，继续其在DenseNet和ConvNeXt模型上的创新研究，推动人工智能领域的发展。 🧮 算术运算新突破：南京大学CAEF框架提升大型语言模型计算能力南京大学研究团队开发的CAEF框架，使LLM在算术运算中实现近乎100%的准确率，显著提升其在算术领域的应用能力。 🤖 智能体评估新标准：Meta发布Agent-as-a-Judge框架 Meta的Agent-as-a-Judge框架通过智能体评估其他智能体的表现，显著提升评估效率和性价比，为智能体评估带来新标准。 💻 Windows版ChatGPT上线：OpenAI推出全新应用体验 OpenAI正式推出适用于Windows系统的ChatGPT应用程序，支持文件上传、图像生成等功能，未来还将加入更多新特性。 📚 科研利器上线：机器之心推出一键获取前沿AI论文服务机器之心推出的全新服务，帮助用户一键免费获取前沿AI论文，提升科研效率。 🤖 双臂机器人新里程碑：清华大学开源RDT大模型清华大学TSAIL团队开源的RDT大模型，通过模仿学习实现多种复杂任务，成为全球最大的双臂机器人扩散大模型。

5分钟

2024.10.19 | AI 新闻速递

🚀 英伟达开源Nemotron 70B：超越GPT-4o的AI新星英伟达近日开源了其强大的大型语言模型Nemotron 70B，该模型在多个基准测试中表现优异，超越了OpenAI的GPT-4o和Anthropic的Claude-3.5 Sonnet等知名模型。 🚁 无人机定位革命：LoD-Loc技术引领新纪元 LoD-Loc是一种基于三维城市白模地图的无人机空中定位新方法，已被NeurIPS 2024会议录用，显著提升了定位精度并降低了存储需求和隐私风险。 🌐 全球首个全模态对齐框架：Align-Anything震撼发布北京大学对齐小组推出了全球首个全模态对齐框架Align-Anything，支持文本、图像、音频、视频等多种模态的输入和输出对齐，填补了现有框架的空白。 🎬 火山引擎AI视频生成：电影级效果，成本大幅降低火山引擎在2024年视频云技术大会上展示了其最新的AI视频生成技术，豆包·视频生成模型在表情、动作和光影处理上达到了电影级别，并大幅提升了处理效率。 👤 TopoFR：拓扑对齐人脸识别模型开源 FaceChain团队在NeurIPS 2024上推出了开源的拓扑对齐人脸表征模型TopoFR，显著提高了人脸识别的精度，相关论文和代码已公开。 🐾 AI宠物机器人热潮：Moflin和Aibi引领新潮流 CASIO和Living AI公司分别推出了Moflin和Aibi口袋宠物机器人，展现了AI技术在宠物机器人领域的应用前景，两款产品均迅速售罄。 ⏳ 连续时间一致性模型：扩散模型采样速度大幅提升 OpenAI的研究科学家路橙与战略探索团队负责人宋飏合作发表论文，提出了简化、稳定化和扩展连续时间一致性模型的技术，显著提升了扩散模型的采样速度。

3分钟

2024.10.18 | AI 新闻速递

🏛️ AI重塑文化遗产：火山引擎推出虚拟直播间火山引擎利用AI技术为百年古建筑生成3D数字资产，应用于抖音戏曲直播，提升观众沉浸式体验。 🌯 AI游戏新纪元：《沙威玛传奇》火爆全网 AI制作的土耳其卷饼小游戏《沙威玛传奇》力压《王者荣耀》，展示AI在游戏开发中的巨大潜力。 💼 AI赋能企业IT：火山引擎发布大模型IT赋能平台火山引擎推出行业首个大模型IT赋能平台，提升企业IT管理效率和员工办公体验。 🤖 AI公平性挑战：ChatGPT存在刻板印象问题 OpenAI研究发现ChatGPT在响应用户请求时可能存在刻板印象，呼吁改进AI模型的公平性。 🧠 AI双系统模型：Meta FAIR推出Dualformer Meta FAIR团队提出新型Transformer架构Dualformer，模仿人类思考系统，提升推理能力。 🧬 AI解析生物语言：2024诺贝尔化学奖聚焦计算蛋白质设计清华大学聂再清教授团队致力于构建生物医药基座大模型，提升药物研发效率。 🎥 AI视频生成测评：腾讯AI Lab发布类SORA模型报告腾讯AI Lab与中科大合作评估13个视频生成模型，提升视频生成技术水平。 ⚡ AI加速等离子体研究：中科院合肥物质科学研究院取得新进展中科院团队利用神经网络模型快速预测等离子体旋转速度和离子温度。 🖼️ AI多模态生成：字节跳动推出TextHarmony模型字节跳动与华东师范大学合作推出多模态生成模型TextHarmony，提升视觉文字生成效果。 ☀️ AI助力光催化：浙大推出全自动高通量光催化反应系统浙江大学和之江实验室研发全自动高通量光催化反应系统，加速新化学产品研发。

6分钟

2024.10.17 | AI 新闻速递

🌋 火山引擎发布大模型训练视频预处理方案，AI视频技术迎来新突破火山引擎在视频云技术大会上推出了大模型训练视频预处理方案，通过自研的多媒体处理框架BMF，有效解决了视频大模型训练中的成本、质量和性能问题，推动了视频内容生成和处理的技术革新。 👓 AI眼镜引发隐私争议：哈佛学生开发的眼镜能通过面部照片扒出个人信息哈佛学生开发的AI眼镜展示了强大的面部识别能力，仅需一张照片即可扒出个人信息，引发了关于隐私保护的深刻讨论。 🔍 AI驱动的科学搜索引擎助力研究：Elicit、Consensus和You通过LLM快速筛选论文人工智能驱动的科学搜索引擎如Elicit、Consensus和You，通过大型语言模型帮助研究人员快速筛选和总结研究论文的关键发现，提高了研究效率。 🧬 Deepurify模型提升宏基因组组装基因组质量，AI在生物信息学领域取得新进展香港浸会大学与英伟达AI技术中心的研究团队开发的Deepurify模型，通过对比学习显著提升了宏基因组组装基因组（MAG）的质量，展示了AI在生物信息学领域的应用潜力。 🚀 微软AI副总裁Sebastien Bubeck加盟OpenAI，推动AGI发展微软人工智能副总裁Sebastien Bubeck宣布加入OpenAI，继续致力于AGI的开发，有望在AGI方向上产出更多成果，推动AI技术的进步。 📊 人大刘勇团队提出“反向瓶颈”理论，为大语言模型训练提供新视角中国人民大学的刘勇团队对大语言模型后训练任务中合成数据的生成过程进行了数学建模，提出了“反向瓶颈”视角，为合成数据的应用提供了理论基础。 📚 AI系统将物理课本图表转化为动画，获ACM UIST 2024最佳论文奖卡尔加里大学与Adobe研究院合作开发的AI系统，能够将物理课本中的静态图表转化为动画，使物理概念更加直观和易于理解，展示了AI技术在教育领域的前沿应用潜力。 🔄 北大林宙辰团队提出MixCon架构，解决长程依赖建模难题北京大学林宙辰团队提出的MixCon架构，结合了注意力机制的Transformer层、Conba层和MoE组件，显著提升了模型在处理长序列时的性能，为自然语言处理等领域提供了创新解决方案。 📱 联发科天玑9400芯片引领AI手机进入智能体化时代联发科推出的新一代旗舰5G智慧体AI芯片天玑9400，大幅提升了手机的AI算力，支持端侧AI训练和多模态大模型推理，标志着AI手机进入智能体化时代。

6分钟

2024.10.16 | AI 新闻速递

🔍 Kimi探索版：AI搜索的革命性突破月之暗面推出Kimi探索版，搜索量提升10倍，精读能力显著增强，模拟人类推理思考过程，引发广泛关注，“Kimi崩了”登上热搜。 🧪 ChemFlow框架：分子设计的AI新纪元康奈尔大学等机构提出ChemFlow框架，利用生成式AI实现高效属性控制，统一先前方法，具备灵活性和可扩展性，有望在药物设计和材料科学中发挥重要作用。 🧠 统计物理学与AI：算法行为的新视角瑞士洛桑联邦理工学院的Lenka Zdeborová教授将统计物理学原理应用于计算机科学和机器学习领域，揭示算法行为和大型语言模型的新理解，为未来机器学习的热力学理论奠定基础。 💡 LightRAG系统：降低LLM检索成本的利器港大黄超团队发布LightRAG开源系统，通过结合图结构和双层检索机制，大幅降低大型语言模型的检索增强成本，提升信息检索的准确性和效率。 ⚖️ CAIL 2024：推动法律智能技术评测中国法律智能技术评测CAIL 2024正式启动，设置七个任务，提供海量司法文书数据，重点关注司法大模型的法律认知能力，推动人工智能技术在法律领域的应用。 🚀 REPA技术：革新扩散模型训练方法纽约大学谢赛宁研究者提出REPA表征对齐技术，显著提升扩散模型训练效率和生成质量，将收敛速度提升17.5倍以上，生成质量达到FID=1.42的当前最佳结果。 🔗 OpenR框架：增强LLM复杂推理能力伦敦大学学院等机构联合开源OpenR全链条训练框架，集成过程奖励模型、强化学习、多种搜索框架，增强大型语言模型的复杂推理能力，推动推理领域开源社区的发展。 🔄 minLSTM和minGRU：RNN模型的简化与提速图灵奖得主Yoshua Bengio团队简化LSTM和GRU模型，得到minLSTM和minGRU，训练参数显著减少，处理长序列速度提升235倍和175倍，性能可与Transformer媲美。