【AI日报】
1. **阿里通义万相Wan2.1-VACE开源**
- 阿里通义万相宣布Wan2.1-VACE开源,支持多种分辨率和任务,提供一站式视频创作体验。
- 支持文生视频、图像参考生成、局部编辑与视频扩展等多种任务,提高创作效率。
- 强大的可控重绘能力,基于人体姿态、运动光流等控制生成,支持主体和背景参考。
- 提出视频条件单元VCU,统一多模态输入,实现多任务自由组合与灵活编辑。
- 详情链接: [https://github.com/Wan-Video/Wan2.1](https://github.com/Wan-Video/Wan2.1)
2. **OpenAI升级ChatGPT:正式引入GPT-4.1**
- OpenAI发布了GPT-4.1及其轻量级版本GPT-4.1mini,显著增强了编码能力和指令执行体验。
- GPT-4.1具备强大的编码能力,处理复杂编程需求更高效,运行速度更快。
- GPT-4.1mini轻量级且高效,在资源受限设备上仍能流畅运行,为用户提供广泛访问渠道。
- ChatGPT新增多项功能如长按复制、表格复制和流式传输,界面优化显著提升用户体验。
3. **Stability AI开源341M超轻量文字转语音模型**
- Stability AI发布了一款名为‘Adversarial Post-Training加速的快速文字转音频生成’的超轻量文字转语音模型,参数仅为341M。
- 该模型能在H100GPU上75毫秒生成12秒音频,在手机CPU上7秒完成同样任务,性能炸裂且多样性强。
- ARC后训练方法不基于蒸馏,提升模型生成速度与质量。
- 模型轻量化设计,支持手机本地运行,大幅提升移动端创意应用体验。
- 详情链接: [https://arxiv.org/pdf/2505.08175](https://arxiv.org/pdf/2505.08175)
4. **Poe报告:可灵大模型视频生成量约占30%份额**
- 可灵大模型在文生视频领域市场份额达30%,领先Runway等竞争者。
- 可灵2.0模型自4月发布后三周内即占据21%视频生成市场。
- 可灵AI全球用户超2200万,月活跃用户增长25倍,生成视频与图片数量显著增加。
5. **微软WizardLM团队“集体跳槽”腾讯**
- 微软的人工智能研究团队WizardLM整体加入腾讯AI实验室的“混元”团队,强化了腾讯在大模型领域的竞争力。
- Hunyuan-TurboS0416模型首次使用“混元”命名,象征着团队与腾讯的深度融合。
- 腾讯计划大幅增加AI投资,目标是在全球AI竞争中占据更为主导的地位。
6. **腾讯宣布混元图像2.0将于5月16日全新发布**
- 混元图像2.0将于5月16日发布,标志着腾讯在AI视觉领域的又一重要进展。
- 新工具强调‘更智能、更开放、更中国’,助力创作者和企业迈向AI驱动的视觉生产新时代。
- 继去年混元大模型升级后,腾讯再次展示其在人工智能领域的持续创新力。
7. **上海启动人工智能标识生态联盟**
- 上海市成立的人工智能标识生态联盟,旨在推动人工智能领域的标识技术发展,提高生成内容的透明度和安全性。
- 国家互联网应急中心和中国电子技术标准化研究院解读相关政策,强调国际规则与中国特色的结合。
- 小红书、MiniMax等企业参与标识工作实践,探索多种内容的标识方案并积累治理经验。
8. **Lightricks发布LTX-Video-13B精炼模型**
- Lightricks发布的开源AI视频生成模型LTX-Video-13B精炼模型,以130亿参数为基础,结合多尺度渲染技术和高效量化优化。
- 10秒内生成高清视频,速度提升5倍以上。
- 开源模型,支持低显存设备运行,降低AI视频制作成本。
- 生成速度提升30倍,媲美专业影视作品,重塑内容创作生态。
- 详情链接: [https://github.com/Lightricks/LTX-Video](https://github.com/Lightricks/LTX-Video)
9. **谷歌AlphaEvolve发布!Gemini自进化AI破解数学难题**
- 谷歌DeepMind发布的AlphaEvolve是一款结合Gemini大语言模型与进化算法的AI编码代理。
- 在多个领域展现了强大的自优化能力,包括数据中心调度、芯片设计、AI训练以及数学研究。
- AlphaEvolve优化数据中心调度,回收0.7%全球算力,节省运营成本。
- 提升AI训练效率,Gemini模型训练速度提升32.5%,展现强大自我优化能力。
10. **腾讯元宝浏览器插件尝鲜版上线Chrome**
- 腾讯元宝浏览器插件尝鲜版上线Chrome平台,提供悬浮球、常驻侧边栏和划词工具栏等功能,提升网页浏览与信息处理效率。
- 悬浮球功能支持一键翻译和总结网页内容,轻松跨越语言障碍并节省阅读时间。
- 常驻侧边栏可高效答疑,支持截图提问,大幅提升信息获取效率。
- 划词工具栏实现选中文本后的即时搜索或翻译,让信息处理更流畅。
- 详情链接: [https://yuanbao.tencent.com/download](https://yuanbao.tencent.com/download)
空空如也
暂无小宇宙热门评论