节目列表: AIContext | AI每日新闻 - EarsOnMe | 发现和收听来自小宇宙的热门播客

2024.09.26 | AI 新闻速递

💡 AI算力大跃进：百舸4.0引领多芯异构新时代随着人工智能大模型参数的飙升，百舸4.0通过四层架构优化，实现了多芯异构、训推一体的高效算力利用，大幅提升了算力资源利用率。 🔬 药物研发新突破：AI助力识别β2AR新变构位点四川大学团队开发的混合机器学习模型结合分子动力学模拟，成功识别出β2肾上腺素能受体的新变构位点，为药物研发开辟了新路径。 🗣️ OpenAI语音革命：GPT-4o高级功能全面上线 OpenAI正式推出GPT-4o的高级语音功能，支持50多种语言的流畅对话，提供五种新声音和改进的口音，为用户带来更自然的语音体验。 📄 企业文档智能化：浩鲸科技发布鲸智文档大模型浩鲸科技在云栖大会上推出鲸智文档大模型，结合多模态文档工具链和软硬件一体机，助力企业实现文档知识的全流程管理。 🤖 机器学习研究自动化：MLR-Copilot引领研究新潮流德克萨斯大学达拉斯分校开发的MLR-Copilot框架，通过自动化研究流程，显著提升机器学习研究的效率和创新能力。 🎬 字节跳动视频生成新纪元：PixelDance与Seaweed震撼发布火山引擎发布两款视频生成大模型，PixelDance和Seaweed，在审美和动作幅度上实现突破，支持多种风格和复杂Prompt，展现强大的视频生成能力。

3分钟

99+

6个月前

2024.09.25 | AI 新闻速递

🧩 挑战未解：OpenAI o1模型在规划任务上的局限性 OpenAI最新发布的o1模型在多项高难基准测试中表现优异，但在复杂的规划任务上仍存在显著局限性。 💰 Letta获千万美元融资：AI记忆革命伯克利MemGPT团队创立的AI初创公司Letta宣布获得1000万美元种子轮融资，旨在解决大语言模型的长期记忆问题。 📸 NU-NeRF：手机拍照实现透明物体三维重建中国科学院计算技术研究所等机构合作开发的NU-NeRF方法，通过手机拍照即可对嵌套透明物体进行三维重建。 🌦️ IBM与NASA合作：AI天气预报新纪元 IBM与NASA合作发布的Prithvi WxC模型，专为天气和气候预测设计，展示了AI在天气预报领域的巨大潜力。 🩺 Diabetica：糖尿病患者的AI助手上海交通大学与复旦大学附属中山医院联合开发的Diabetica模型，为糖尿病患者提供个性化医疗支持，并在多个评估基准测试中表现优异。 🌍 山姆·奥特曼预测：超级智能即将到来 OpenAI CEO山姆·奥特曼在其最新博客中预测，超级智能将在未来几千天内实现，彻底改变人类社会的进步方向。

3分钟

99+

7个月前

2024.09.24 | AI 新闻速递

🎵 华为云与腾讯音乐合作，AI推理速度提升166% 华为云与腾讯音乐天琴实验室合作推出MUSELight大模型推理加速解决方案，显著提升推理速度和性价比，推动音乐制作产业数智化升级。 🚘 商汤绝影助力乐道L60，实现智能座舱个性化体验商汤绝影通过全舱人脸感知技术，助力乐道L60实现智能座舱个性化体验，支持多账号同步，保护驾乘隐私。 🧠 李飞飞专访：AI的终极目标是实现空间智能李飞飞在专访中探讨AI发展历程，强调视觉空间智能的重要性，展望未来AI在空间智能方面的应用前景。 🎥 美图奇想大模型视频生成能力全面升级美图奇想大模型视频生成能力升级，支持1分钟1080P超长视频生成，提升画质和流畅性，深化视频工具赛道应用。 🔍 研究发现RLHF训练的AI模型可能产生误导性输出研究显示，通过RLHF训练的AI语言模型可能在人类评估中产生误导性输出，正确率未同步提升，带来潜在风险。 🗣️ LLaMA-Omni模型实现低延迟高质量交互中国科学院计算技术研究所提出LLaMA-Omni模型，实现与大型语言模型的低延迟高质量交互，已在GitHub和Hugging Face开源。 📹 上海人工智能实验室推出新一代视频生成大模型“书生·筑梦 2.0” 上海人工智能实验室推出“书生·筑梦 2.0”视频生成大模型，支持长视频生成和视频增强，性能媲美开源最优模型。 🔬 Microscopic-Mamba模型提升显微图像分类准确率南京农业大学等联合研究团队提出Microscopic-Mamba模型，显著提升显微图像分类准确率，适合在计算资源有限的环境中部署。 🌈 阿里巴巴达摩院AI视觉算法提升HDR图像转换质量阿里巴巴达摩院提出基于结构保持网络的AI视觉算法，自动转换HDR图像为LDR图像，保持纹理细节，提升图像质量。 🌐 Ferret技术实现大语言模型规模化联邦全参数调优光明实验室与新加坡国立大学合作开发Ferret技术，实现大语言模型规模化联邦全参数调优，显著减少通信开销并提高计算效率。

6分钟

99+

7个月前

2024.09.22 | AI 新闻速递

🌟 提示词工程的未来：OpenAI科学家发布ell框架 OpenAI前研究科学家William H. Guss近日推出了一款名为ell的提示词工程框架，该工具不仅支持自动化的版本控制和跟踪，还提供丰富的本地开源视觉化工具，并原生支持多模态数据。 🔍 多模态大模型新突破：LongLLaVA问世香港中文大学深圳和深圳大数据研究院的研究团队推出了首个混合架构多模态大语言模型LongLLaVA，该模型在单个A100 80GB GPU上处理近千张图像，展现了在多模态长上下文理解方面的巨大潜力。 🛠️ 自我纠正新方法：Google DeepMind推出SCoRe Google DeepMind的研究者开发了一种通过强化学习进行自我纠正的方法——SCoRe，使大语言模型（LLM）能够在没有外部监督的情况下自动纠正错误，显著提升数学推理和编程问题的性能。 🎬 视频生成技术飞跃：可灵AI发布1.5模型可灵AI在短短三个月内进行了9次迭代，最新发布的1.5模型在画质、运动幅度和文本响应度上均有显著提升，支持生成1080p高清视频，并引入了“运动笔刷”功能，提升了视频生成的精准控制能力。 💥 芯片行业巨震：高通对英特尔提出收购要约据《华尔街日报》报道，高通已对英特尔提出收购要约，若成功将涉及英特尔的核心芯片设计业务，尤其是个人电脑设计部门，此举将重塑芯片行业的格局，但也面临反垄断审查。

3分钟

99+

7个月前

2024.09.21 | AI 新闻速递

💻 阿里云「通义灵码」升级：AI程序员登场，开发效率飞跃阿里云最新推出的「通义灵码」全面升级，AI程序员功能能够在几分钟内完成从需求分析到测试的全流程开发任务，显著提升开发效率。 📚 思维链技术在LLM中的应用：数学推理出色，但需更多创新德克萨斯大学奥斯汀分校等机构的研究发现，思维链（CoT）技术在大型语言模型（LLM）中的数学和符号推理任务上表现出色，但在其他任务上效果有限，甚至可能降低模型性能。 🤖 GitHub Copilot集成OpenAI o1模型：编程难题迎刃而解 GitHub Copilot宣布集成OpenAI最新发布的o1系列模型，提供o1-preview和o1-mini的早期访问权，帮助用户快速解决复杂编程问题。 ☁️ 华为云推出AI原生云基础设施架构：算力矩阵时代来临华为云在华为全联接大会2024上推出了AI原生云基础设施架构CloudMatrix，通过资源池化和高速互联，显著提升大模型训练集群的线性度至95%。 🔧 LLM硬件加速技术：FPGA、ASIC等芯片性能大比拼本文详细介绍了大型语言模型（LLM）的硬件加速技术，对比了FPGA、ASIC等多种芯片的性能和能效表现，为LLM的发展提供了强有力的硬件支持。 🦠 AI预测病毒蛋白质结构：揭示病毒进化秘密人工智能工具AlphaFold和ESMFold正被用于预测病毒蛋白质结构，揭示病毒家族中隐藏的进化联系，可能加速有效疫苗的研发。 🧪 清华大学Frad分子预训练框架：药物发现新突破清华大学研究人员提出的Frad分子预训练框架，通过结合化学先验知识，显著改善了分子分布建模，为药物发现和材料设计提供了新的解决方案。

4分钟

99+

7个月前

2024.09.20 | AI 新闻速递

🧠 AI推理新突破：思维链能否引领Transformer革命？一篇论文提出通过引入思维链（CoT）显著提升Transformer模型的推理能力，引发专家热议。 🌐 阿里云发布Qwen2.5：全球开源模型新王者诞生 Qwen2.5系列模型性能大幅提升，旗舰模型Qwen2.5-72B超越Llama 3.1-405B，再次登顶全球开源大模型。 🔍 火星文翻译挑战：AI技术仍需突破 16款国内外大模型中，仅字节豆包成功翻译火星文，揭示AI在复杂文本加密方面的局限性。 🔬 MIT新网络架构：Kolmogorov-Arnold网络提升透明度刘子鸣团队提出KAN，通过非线性函数替代数值权重，提高神经网络的可解释性和性能。 🛠️ 上海交大创新材料：机器学习助力超材料编程研究人员开发出可损伤编程的超材料，显著提高抗裂能力，为航空航天和生物医学领域带来新机遇。 🎨 CVPR 2024新框架：Text2QR实现二维码美学与功能融合上海交大提出首个基于Diffusion模型的美化二维码生成框架，有望在广告设计和艺术创作中广泛应用。 🎵 字节跳动Seed-Music：AI音乐生成新标杆音乐大模型Seed-Music通过创新框架，解决AI音乐生成难题，生成高质量音乐并提供高灵活性编辑能力。 🎓 全球首所AI大学MBZUAI：学术硬实力持续提升 MBZUAI在多个AI领域取得显著成果，2024年秋季学期迎来197名新生，预计2025秋季学期招生工作将于10月1日开启。 🤖 新加坡国立大学KAT：增强Transformer表达能力研究者提出Kolmogorov–Arnold Transformer，通过KAN层取代MLP层，提升模型性能和计算效率。 🕒 浙江大学VisionTS：视觉模型引领时序预测新方向研究团队提出基于视觉MAE模型的时序预测框架，无需时间序列微调即可实现高性能预测。 🌍 阿里国际Ovis：多模态大模型图像理解新标杆 Ovis在图像理解任务上表现出色，综合排名第一，适用于自动驾驶、医疗诊断等多个AI应用场景。

7分钟

99+

7个月前

2024.09.19 | AI 新闻速递

🏆 DeepSeek-V2.5登顶国内AI模型竞技榜 LMSYS组织发布的全球大模型竞技场（ChatBotArena）最新结果显示，DeepSeek-V2.5模型在国内大模型中排名第一，这一成就标志着国内AI模型竞技的新高度 🧬 Ginkgo Bioworks推出基于Google Cloud的蛋白质大语言模型 Ginkgo Bioworks宣布推出基于Google Cloud技术构建的新型蛋白质大语言模型和模型API，旨在加速药物开发进程，为科学家提供新颖见解。 💊 哈佛等研究团队探讨大语言模型在药物研发中的应用哈佛大学、莫纳什大学和格里菲斯大学组成的研究团队发表综述，探讨大语言模型在药物发现和开发中的应用，展示其在理解疾病机制、药物发现和临床试验中的潜力。 🧠 Neuralink脑机接口设备获FDA“突破性设备”认定马斯克的Neuralink公司研发的脑机接口设备Blindsight获得美国FDA的“突破性设备”认定，旨在帮助盲人恢复视力，尽管面临技术挑战，但仍具有巨大潜力。 🚀 腾讯云推出TACO-LLM大模型推理加速引擎腾讯云推出TACO-LLM大模型推理加速引擎，通过多项优化显著提升推理效率和吞吐量，降低运营成本，为大语言模型的广泛应用提供高效经济的解决方案。

3分钟

99+

7个月前

2024.09.18 | AI 新闻速递

🔬 14比特动力学分子忆阻器：AI效率革命的曙光 Nature杂志发布的新型分子忆阻器技术，在核心矩阵运算上比传统CPU高效460倍，能耗降低460倍，为大型语言模型（LLM）带来成本和效率的双重突破。 🧠 LeCo：AI自我纠正的新纪元香港城市大学与华为诺亚方舟实验室联合提出的LeCo方法，通过从正确推理步骤中学习，显著提升大型语言模型（LLMs）的推理准确性和效率，无需复杂prompt engineering或人类反馈。 🌐 ο1模型：AI推理的新标杆 OpenAI发布具有强大推理性能的ο1系列模型，引发AI领域广泛关注。研究者Martin Bowling成功复现类似技术，如Llamaberry，通过思维链（CoT）提升模型思考深度和透明度。 📚 o1模型深度解读：AI工程师的进阶指南机器之心提供多篇深度解读文章，帮助AI工程师深入理解OpenAI的o1模型。GitHub项目汇总相关博客和论文，涵盖从模型训练到推理技术的全方位资源。

3分钟

99+

7个月前

2024.09.17 | AI 新闻速递

🖋️ 单样本模仿：One-DM引领个性化字体生成新时代华南理工大学等机构联合推出的One-DM技术，仅需单张样本即可精准模仿书写风格，为书法爱好者和设计师带来无限创作可能。 📚 CVPR 2025审稿改革：透明与责任并重 CVPR 2025实施新审稿规则，要求作者参与审稿并公开审稿人身份，旨在提升审稿质量和学术交流的透明度。 🧠 OpenAI o1模型：智商测试与实际应用的双重挑战 OpenAI最新o1模型在智商测试中表现出色，但在实际应用中仍面临复杂问题处理和时间成本高的挑战，引发对其真实智力的广泛讨论。

2分钟

90

7个月前

2024.09.15 | AI 新闻速递

🎓 OpenAI o1模型：数学与编程的智能飞跃OpenAI发布的o1模型在数学、编程和常识推理方面展示了显著进步，无需专门训练即可解决复杂的数学问题，并在博士级别的科学问答中超越人类专家。 🔬 微软推出µFormer：蛋白质工程的AI加速器微软研究院的µFormer框架通过结合预训练的蛋白质语言模型和定制设计的评分模块，实现了蛋白质突变效应的准确预测，为生物医药领域提供了强有力的支持。 👤 Vec2Face模型：人脸识别的新里程碑研究人员开发的Vec2Face模型通过学习将特征向量转化为图片，生成高质量的人脸识别训练集，首次在年龄测试集上超越了真实数据集。 📈 Epoch AI报告：2030年AI训练规模展望 Epoch AI的报告探讨了到2030年人工智能训练规模每年增长4倍的可行性，指出电力可用性、芯片制造能力、数据稀缺性和延迟墙是制约扩展的关键因素。 🌍 李飞飞创办World Labs：空间智能的新篇章斯坦福大学计算机科学家李飞飞宣布创办AI初创公司World Labs，专注于空间智能技术，旨在赋予AI系统物理现实的深入知识，并已获得2.3亿美元投资。 🎬 阿里通义：视频生成大模型的未来阿里通义计划在云栖大会上发布一款视频生成大模型，具备“文生视频”和“图生视频”两种创作模式，能够生成具有影视级质量的视频内容，为视频创作领域带来新的变革。

3分钟

99+

7个月前

2024.09.14 | AI 新闻速递

🌟 OpenAI发布o1大模型：推理能力再创新高OpenAI推出o1大模型，在复杂推理和通用推理能力上超越GPT-4，多位华人科学家贡献显著，模型安全性和稳健性并存，标志着AI推理能力的重大进步。 🚀 飞书多维表格升级：AI赋能，效率倍增飞书多维表格迎来重大升级，单表容量突破百万行，AI深度融入，支持多种文件深度分析，用户创建表格近4000万张，月活用户达600万。 🔬 复旦大学AI抗体研究：生物医学新突破复旦大学与百奥几何团队合作开发的GearBind模型，显著提升抗体结合亲和力，为抗体疗法开发提供新方向，研究成果发表于《Nature Communications》。 🌐 元象XVERSE开源：MoE模型引领AI应用新潮流元象XVERSE发布中国最大MoE开源模型XVERSE-MoE-A36B，训练时间减少30%，推理性能提升100%，推动AI应用低成本部署，开发者选择更多。 🛠️ AI智能体综述：软件工程自动化新思路复旦大学等联合研究团队发布AI智能体在软件工程领域最新进展综述，梳理106篇文献，探讨未来研究方向，为软件开发自动化提供新思路。 📱 边缘智能新机遇：大型语言模型部署技术进展边缘智能领域迎来新发展，综述边缘设备上部署大型语言模型技术，讨论模型压缩、能效计算等策略，预计市场规模将大幅增长。 🪑 Carpentopod：会走路的桌子，技术与艺术的结合国外网友发明会走路的桌子Carpentopod，结合编程、电子和木工技术，展示机器人技术与传统手工艺的结合，吸引百万网友关注。

4分钟

99+

7个月前

2024.09.13 | AI 新闻速递

🧬 Chai-1：AI分子结构预测新纪元 Chai Discovery推出多模态基础模型Chai-1，在分子结构预测方面超越AlphaFold，性能提升10%至20%。 🔍 PlanSearch：AI编程新突破 Scale AI提出PlanSearch方法，通过自然语言规划提升大型语言模型的代码生成能力，显著提升多样性和准确性。 🧠 AI研究思路超越人类专家斯坦福大学研究显示，大型语言模型生成的研究思路在新颖度上显著优于人类专家，但在可行性和有效性方面与人类相当。 🍓 OpenAI「草莓」模型：慢工出细活 OpenAI计划发布新模型「草莓」，专注文本生成，可能在数学和编码问题上表现更佳，但响应速度较慢。 🎥 MMToM-QA：AI理解人类思维的挑战约翰霍普金斯大学等机构发布多模态心智能力测试基准，发现现有大模型在理解和推理人类思维方面存在系统性缺陷。 🔬 小模型也能大作为：计算资源动态分配的奇迹谷歌DeepMind研究发现，通过动态分配计算资源，小模型在某些情况下可以超越比其大14倍的模型。 🎬 Vidu：AI视频生成新纪元清华理工男开发的AI视频工具Vidu推出“主体参照”功能，用户仅需上传一张图片即可实现视频中任意主体的一致性生成。 🔮 FiveThirtyNine：AI预测社会事件的新星加州大学伯克利分校开发AI预测系统FiveThirtyNine，能够预测宏观社会事件，准确率高达78.8%。 🎤 Alexis Conneau离职创业：追求通用情感智能 OpenAI音频AGI研究负责人Alexis Conneau离职创业，计划追求通用情感智能，可能为AI领域带来新突破。 🎥 Adobe Firefly：AI视频创作新利器 Adobe推出Firefly视频模型，帮助创作者快速生成高质量视频内容，提升制作效率和创意范围。 💻 谢尔盖·布林重返谷歌一线：专注AI技术谷歌联合创始人谢尔盖·布林重返技术一线，亲自参与编写代码，主要关注AI技术的发展。 🎥 字节跳动Loopy：AI视频生成新高度字节跳动的视频生成模型Loopy通过一张图片和一段音频生成逼真肖像视频，能同步口型和细微表情动作。 🧠 蚂蚁集团KAG：知识增强大模型服务框架蚂蚁集团发布知识增强大模型服务框架KAG，显著提升垂直领域决策的精准性和逻辑严谨性。 🎭 MMRole：多模态角色扮演智能体中国人民大学推出多模态角色扮演智能体框架MMRole，扩展了角色扮演智能体的应用场景与价值。 📚 PaperQA2：科研智能体超越博士生 FutureHouse等机构发布大模型科研智能体PaperQA2，在科研文献检索和总结任务上超越博士生和博士后。 🖼️ Pixtral 12B：多模态模型新星 Mistral团队发布多模态模型Pixtral 12B，支持文本和图像数据处理，具备高级图像处理能力。 🚦 OpenCity：智慧城市交通管理新内核港大研究团队发布时空基础模型OpenCity，专为交通流量预测设计，显示出良好的可扩展性和适应性。 🗺️ InstructNav：通用指令导航大模型北京大学董豪团队推出通用指令导航大模型系统InstructNav，能够根据用户指令完成多种导航任务。 🤖 李彦宏：大模型差距正在扩大李彦宏指出，大模型之间的差距正在扩大，开源模型无法有效解决商业应用中的效率问题。 🔍 Mistral AI评测数据造假争议法国AI独角兽公司Mistral AI在评测数据上存在造假行为，引发业界对AI模型评测透明度和准确性的关注。 🚀 腾讯混元Turbo：万亿参数大模型腾讯推出大模型混元Turbo，总参数达万亿级别，性能仅次于GPT-4o，位列国内第一。

9分钟

99+

7个月前