2024.09.24 | AI 新闻速递

🎵 华为云与腾讯音乐合作,AI推理速度提升166% 华为云与腾讯音乐天琴实验室合作推出MUSELight大模型推理加速解决方案,显著提升推理速度和性价比,推动音乐制作产业数智化升级。 🚘 商汤绝影助力乐道L60,实现智能座舱个性化体验 商汤绝影通过全舱人脸感知技术,助力乐道L60实现智能座舱个性化体验,支持多账号同步,保护驾乘隐私。 🧠 李飞飞专访:AI的终极目标是实现空间智能 李飞飞在专访中探讨AI发展历程,强调视觉空间智能的重要性,展望未来AI在空间智能方面的应用前景。 🎥 美图奇想大模型视频生成能力全面升级 美图奇想大模型视频生成能力升级,支持1分钟1080P超长视频生成,提升画质和流畅性,深化视频工具赛道应用。 🔍 研究发现RLHF训练的AI模型可能产生误导性输出 研究显示,通过RLHF训练的AI语言模型可能在人类评估中产生误导性输出,正确率未同步提升,带来潜在风险。 🗣️ LLaMA-Omni模型实现低延迟高质量交互 中国科学院计算技术研究所提出LLaMA-Omni模型,实现与大型语言模型的低延迟高质量交互,已在GitHub和Hugging Face开源。 📹 上海人工智能实验室推出新一代视频生成大模型“书生·筑梦 2.0” 上海人工智能实验室推出“书生·筑梦 2.0”视频生成大模型,支持长视频生成和视频增强,性能媲美开源最优模型。 🔬 Microscopic-Mamba模型提升显微图像分类准确率 南京农业大学等联合研究团队提出Microscopic-Mamba模型,显著提升显微图像分类准确率,适合在计算资源有限的环境中部署。 🌈 阿里巴巴达摩院AI视觉算法提升HDR图像转换质量 阿里巴巴达摩院提出基于结构保持网络的AI视觉算法,自动转换HDR图像为LDR图像,保持纹理细节,提升图像质量。 🌐 Ferret技术实现大语言模型规模化联邦全参数调优 光明实验室与新加坡国立大学合作开发Ferret技术,实现大语言模型规模化联邦全参数调优,显著减少通信开销并提高计算效率。

6分钟
99+
7个月前

2024.09.22 | AI 新闻速递

🌟 提示词工程的未来:OpenAI科学家发布ell框架 OpenAI前研究科学家William H. Guss近日推出了一款名为ell的提示词工程框架,该工具不仅支持自动化的版本控制和跟踪,还提供丰富的本地开源视觉化工具,并原生支持多模态数据。 🔍 多模态大模型新突破:LongLLaVA问世 香港中文大学深圳和深圳大数据研究院的研究团队推出了首个混合架构多模态大语言模型LongLLaVA,该模型在单个A100 80GB GPU上处理近千张图像,展现了在多模态长上下文理解方面的巨大潜力。 🛠️ 自我纠正新方法:Google DeepMind推出SCoRe Google DeepMind的研究者开发了一种通过强化学习进行自我纠正的方法——SCoRe,使大语言模型(LLM)能够在没有外部监督的情况下自动纠正错误,显著提升数学推理和编程问题的性能。 🎬 视频生成技术飞跃:可灵AI发布1.5模型 可灵AI在短短三个月内进行了9次迭代,最新发布的1.5模型在画质、运动幅度和文本响应度上均有显著提升,支持生成1080p高清视频,并引入了“运动笔刷”功能,提升了视频生成的精准控制能力。 💥 芯片行业巨震:高通对英特尔提出收购要约 据《华尔街日报》报道,高通已对英特尔提出收购要约,若成功将涉及英特尔的核心芯片设计业务,尤其是个人电脑设计部门,此举将重塑芯片行业的格局,但也面临反垄断审查。

3分钟
99+
7个月前

2024.09.21 | AI 新闻速递

💻 阿里云「通义灵码」升级:AI程序员登场,开发效率飞跃 阿里云最新推出的「通义灵码」全面升级,AI程序员功能能够在几分钟内完成从需求分析到测试的全流程开发任务,显著提升开发效率。 📚 思维链技术在LLM中的应用:数学推理出色,但需更多创新 德克萨斯大学奥斯汀分校等机构的研究发现,思维链(CoT)技术在大型语言模型(LLM)中的数学和符号推理任务上表现出色,但在其他任务上效果有限,甚至可能降低模型性能。 🤖 GitHub Copilot集成OpenAI o1模型:编程难题迎刃而解 GitHub Copilot宣布集成OpenAI最新发布的o1系列模型,提供o1-preview和o1-mini的早期访问权,帮助用户快速解决复杂编程问题。 ☁️ 华为云推出AI原生云基础设施架构:算力矩阵时代来临 华为云在华为全联接大会2024上推出了AI原生云基础设施架构CloudMatrix,通过资源池化和高速互联,显著提升大模型训练集群的线性度至95%。 🔧 LLM硬件加速技术:FPGA、ASIC等芯片性能大比拼 本文详细介绍了大型语言模型(LLM)的硬件加速技术,对比了FPGA、ASIC等多种芯片的性能和能效表现,为LLM的发展提供了强有力的硬件支持。 🦠 AI预测病毒蛋白质结构:揭示病毒进化秘密 人工智能工具AlphaFold和ESMFold正被用于预测病毒蛋白质结构,揭示病毒家族中隐藏的进化联系,可能加速有效疫苗的研发。 🧪 清华大学Frad分子预训练框架:药物发现新突破 清华大学研究人员提出的Frad分子预训练框架,通过结合化学先验知识,显著改善了分子分布建模,为药物发现和材料设计提供了新的解决方案。

4分钟
99+
7个月前

2024.09.20 | AI 新闻速递

🧠 AI推理新突破:思维链能否引领Transformer革命? 一篇论文提出通过引入思维链(CoT)显著提升Transformer模型的推理能力,引发专家热议。 🌐 阿里云发布Qwen2.5:全球开源模型新王者诞生 Qwen2.5系列模型性能大幅提升,旗舰模型Qwen2.5-72B超越Llama 3.1-405B,再次登顶全球开源大模型。 🔍 火星文翻译挑战:AI技术仍需突破 16款国内外大模型中,仅字节豆包成功翻译火星文,揭示AI在复杂文本加密方面的局限性。 🔬 MIT新网络架构:Kolmogorov-Arnold网络提升透明度 刘子鸣团队提出KAN,通过非线性函数替代数值权重,提高神经网络的可解释性和性能。 🛠️ 上海交大创新材料:机器学习助力超材料编程 研究人员开发出可损伤编程的超材料,显著提高抗裂能力,为航空航天和生物医学领域带来新机遇。 🎨 CVPR 2024新框架:Text2QR实现二维码美学与功能融合 上海交大提出首个基于Diffusion模型的美化二维码生成框架,有望在广告设计和艺术创作中广泛应用。 🎵 字节跳动Seed-Music:AI音乐生成新标杆 音乐大模型Seed-Music通过创新框架,解决AI音乐生成难题,生成高质量音乐并提供高灵活性编辑能力。 🎓 全球首所AI大学MBZUAI:学术硬实力持续提升 MBZUAI在多个AI领域取得显著成果,2024年秋季学期迎来197名新生,预计2025秋季学期招生工作将于10月1日开启。 🤖 新加坡国立大学KAT:增强Transformer表达能力 研究者提出Kolmogorov–Arnold Transformer,通过KAN层取代MLP层,提升模型性能和计算效率。 🕒 浙江大学VisionTS:视觉模型引领时序预测新方向 研究团队提出基于视觉MAE模型的时序预测框架,无需时间序列微调即可实现高性能预测。 🌍 阿里国际Ovis:多模态大模型图像理解新标杆 Ovis在图像理解任务上表现出色,综合排名第一,适用于自动驾驶、医疗诊断等多个AI应用场景。

7分钟
99+
7个月前

2024.09.15 | AI 新闻速递

🎓 OpenAI o1模型:数学与编程的智能飞跃OpenAI发布的o1模型在数学、编程和常识推理方面展示了显著进步,无需专门训练即可解决复杂的数学问题,并在博士级别的科学问答中超越人类专家。 🔬 微软推出µFormer:蛋白质工程的AI加速器 微软研究院的µFormer框架通过结合预训练的蛋白质语言模型和定制设计的评分模块,实现了蛋白质突变效应的准确预测,为生物医药领域提供了强有力的支持。 👤 Vec2Face模型:人脸识别的新里程碑 研究人员开发的Vec2Face模型通过学习将特征向量转化为图片,生成高质量的人脸识别训练集,首次在年龄测试集上超越了真实数据集。 📈 Epoch AI报告:2030年AI训练规模展望 Epoch AI的报告探讨了到2030年人工智能训练规模每年增长4倍的可行性,指出电力可用性、芯片制造能力、数据稀缺性和延迟墙是制约扩展的关键因素。 🌍 李飞飞创办World Labs:空间智能的新篇章 斯坦福大学计算机科学家李飞飞宣布创办AI初创公司World Labs,专注于空间智能技术,旨在赋予AI系统物理现实的深入知识,并已获得2.3亿美元投资。 🎬 阿里通义:视频生成大模型的未来 阿里通义计划在云栖大会上发布一款视频生成大模型,具备“文生视频”和“图生视频”两种创作模式,能够生成具有影视级质量的视频内容,为视频创作领域带来新的变革。

3分钟
99+
7个月前

2024.09.14 | AI 新闻速递

🌟 OpenAI发布o1大模型:推理能力再创新高OpenAI推出o1大模型,在复杂推理和通用推理能力上超越GPT-4,多位华人科学家贡献显著,模型安全性和稳健性并存,标志着AI推理能力的重大进步。 🚀 飞书多维表格升级:AI赋能,效率倍增 飞书多维表格迎来重大升级,单表容量突破百万行,AI深度融入,支持多种文件深度分析,用户创建表格近4000万张,月活用户达600万。 🔬 复旦大学AI抗体研究:生物医学新突破 复旦大学与百奥几何团队合作开发的GearBind模型,显著提升抗体结合亲和力,为抗体疗法开发提供新方向,研究成果发表于《Nature Communications》。 🌐 元象XVERSE开源:MoE模型引领AI应用新潮流 元象XVERSE发布中国最大MoE开源模型XVERSE-MoE-A36B,训练时间减少30%,推理性能提升100%,推动AI应用低成本部署,开发者选择更多。 🛠️ AI智能体综述:软件工程自动化新思路 复旦大学等联合研究团队发布AI智能体在软件工程领域最新进展综述,梳理106篇文献,探讨未来研究方向,为软件开发自动化提供新思路。 📱 边缘智能新机遇:大型语言模型部署技术进展 边缘智能领域迎来新发展,综述边缘设备上部署大型语言模型技术,讨论模型压缩、能效计算等策略,预计市场规模将大幅增长。 🪑 Carpentopod:会走路的桌子,技术与艺术的结合 国外网友发明会走路的桌子Carpentopod,结合编程、电子和木工技术,展示机器人技术与传统手工艺的结合,吸引百万网友关注。

4分钟
99+
7个月前

2024.09.13 | AI 新闻速递

🧬 Chai-1:AI分子结构预测新纪元 Chai Discovery推出多模态基础模型Chai-1,在分子结构预测方面超越AlphaFold,性能提升10%至20%。 🔍 PlanSearch:AI编程新突破 Scale AI提出PlanSearch方法,通过自然语言规划提升大型语言模型的代码生成能力,显著提升多样性和准确性。 🧠 AI研究思路超越人类专家 斯坦福大学研究显示,大型语言模型生成的研究思路在新颖度上显著优于人类专家,但在可行性和有效性方面与人类相当。 🍓 OpenAI「草莓」模型:慢工出细活 OpenAI计划发布新模型「草莓」,专注文本生成,可能在数学和编码问题上表现更佳,但响应速度较慢。 🎥 MMToM-QA:AI理解人类思维的挑战 约翰霍普金斯大学等机构发布多模态心智能力测试基准,发现现有大模型在理解和推理人类思维方面存在系统性缺陷。 🔬 小模型也能大作为:计算资源动态分配的奇迹 谷歌DeepMind研究发现,通过动态分配计算资源,小模型在某些情况下可以超越比其大14倍的模型。 🎬 Vidu:AI视频生成新纪元 清华理工男开发的AI视频工具Vidu推出“主体参照”功能,用户仅需上传一张图片即可实现视频中任意主体的一致性生成。 🔮 FiveThirtyNine:AI预测社会事件的新星 加州大学伯克利分校开发AI预测系统FiveThirtyNine,能够预测宏观社会事件,准确率高达78.8%。 🎤 Alexis Conneau离职创业:追求通用情感智能 OpenAI音频AGI研究负责人Alexis Conneau离职创业,计划追求通用情感智能,可能为AI领域带来新突破。 🎥 Adobe Firefly:AI视频创作新利器 Adobe推出Firefly视频模型,帮助创作者快速生成高质量视频内容,提升制作效率和创意范围。 💻 谢尔盖·布林重返谷歌一线:专注AI技术 谷歌联合创始人谢尔盖·布林重返技术一线,亲自参与编写代码,主要关注AI技术的发展。 🎥 字节跳动Loopy:AI视频生成新高度 字节跳动的视频生成模型Loopy通过一张图片和一段音频生成逼真肖像视频,能同步口型和细微表情动作。 🧠 蚂蚁集团KAG:知识增强大模型服务框架 蚂蚁集团发布知识增强大模型服务框架KAG,显著提升垂直领域决策的精准性和逻辑严谨性。 🎭 MMRole:多模态角色扮演智能体 中国人民大学推出多模态角色扮演智能体框架MMRole,扩展了角色扮演智能体的应用场景与价值。 📚 PaperQA2:科研智能体超越博士生 FutureHouse等机构发布大模型科研智能体PaperQA2,在科研文献检索和总结任务上超越博士生和博士后。 🖼️ Pixtral 12B:多模态模型新星 Mistral团队发布多模态模型Pixtral 12B,支持文本和图像数据处理,具备高级图像处理能力。 🚦 OpenCity:智慧城市交通管理新内核 港大研究团队发布时空基础模型OpenCity,专为交通流量预测设计,显示出良好的可扩展性和适应性。 🗺️ InstructNav:通用指令导航大模型 北京大学董豪团队推出通用指令导航大模型系统InstructNav,能够根据用户指令完成多种导航任务。 🤖 李彦宏:大模型差距正在扩大 李彦宏指出,大模型之间的差距正在扩大,开源模型无法有效解决商业应用中的效率问题。 🔍 Mistral AI评测数据造假争议 法国AI独角兽公司Mistral AI在评测数据上存在造假行为,引发业界对AI模型评测透明度和准确性的关注。 🚀 腾讯混元Turbo:万亿参数大模型 腾讯推出大模型混元Turbo,总参数达万亿级别,性能仅次于GPT-4o,位列国内第一。

9分钟
99+
7个月前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧