【AI日报】
1. **月之暗面发布全新开源模型Kimi-Dev-72B**
- 专注于软件工程任务的Kimi-Dev-72B在SWE-bench Verified测试中创下最高成绩,以72亿参数量超越了DeepSeek-R1。
- 模型结合BugFixer和TestWriter双重角色,确保代码质量和正确性。
- 未来计划与流行开发工具深度集成,持续优化并推出更强大的版本。
2. **MiniMax-M1开源**
- 上下文窗口达1M输入和80k输出,远超GPT-4o,适合复杂文档分析和多轮对话。
- 训练成本仅53万美元,通过MoE架构和CISPO算法实现高效推理与低成本。
- 开源于Hugging Face平台,支持40k和80k思维预算,性能媲美顶级商业模型。
3. **腾讯LeVo来袭**
- 支持零样本音色克隆,仅需3秒音频即可精准复制音色,大幅降低音乐创作门槛。
- 提供分轨生成模式,支持人声与伴奏分离,为专业音乐制作提供更高灵活性。
- 以开源形式发布,促进全球音乐创作社区的发展,提升中国AI技术国际影响力。
- 详情链接: https://levo-demo.github.io/
4. **阿里巴巴发布Qwen3升级版,适配苹果MLX架构**
- 新版Qwen3支持119种语言,具备更强性能和混合推理能力。
- 苹果智能尚未在中国上线,可能会在iOS18.6正式公测版中提供预览。
5. **豆包电脑版与网页版上线“AI播客”功能**
- 上传PDF或链接即可快速生成自然流畅的双人对话播客。
- 适用于工作、学习等多种场景,利用碎片时间高效获取信息。
- 语音效果逼真,去机器感,提供沉浸式听觉体验。
6. **夸克App推出“夸克老师”**
- 集多种学习功能于一体,如讲题、批作业、出题、找试卷等,支持数学和物理难题的深度解析。
- 能够根据学生特点提供个性化辅导,模拟真人教师教学思路,帮助学生理解并提升学习效果。
- 拥有海量题库资源,包括专业题库和名校真题,满足多样化学习需求。
7. **松下全新OmniFlow多模态大模型**
- 支持文本、图像和音频的高效转换,带来全新的多模态体验。
- 采用模块化设计,各组件独立预训练,提高资源利用效率并优化训练效果。
- 引入多模态引导机制,用户可精准控制生成过程,满足多样化需求。
8. **TikTok全新Symphony AI工具上线**
- 图像转视频功能让静态图片轻松变为动态视频,只需上传图片和添加文字提示即可生成多个AI视频选项。
- 文字转视频功能无需图片或模板,仅凭文字即可制作视频,助力广告商快速测试和完善创意。
- Showcase Products工具融合产品图片与数字化身,打造沉浸式广告体验,提升用户原创内容风格。
9. **极氪与火山引擎携手,豆包大模型赋能智能座舱新体验**
- 豆包大模型接入极氪智能座舱,实现精准推荐与个性化服务。
- 升级后的极氪智能语音助手Eva,支持从传统语音交互到大语言模型服务的无缝切换。
- 极氪第50万台车型009光辉下线,刷新豪华纯电车型最快纪录。
10. **Meta Llama3.1能回忆《哈利波特》42%的内容**
- Llama3.170B模型在《哈利波特》中能记住42%的内容,远超Llama165B的4.4%。
- 研究采用Books3数据库,通过标记段落测试模型的记忆能力。
- 热门书籍记忆效果更佳,显示AI在理解和处理文本上的进步。
11. **Grok任务功能重磅上线**
- 支持多种任务频率,从即时到长期跟踪,满足多样化需求。
- 提供外部通知功能,如邮件推送,结果主动找用户,提升使用便利性。
- SuperGrok用户享有更高配额和优先体验尖端功能,如DeepSearch和Big Brain Mode。
12. **Gemini2.5Pro即将更新Deep Think的功能**
- Deep Think功能通过多线程推理显著提升复杂任务中的性能,特别是在数学、编程和多模态任务中表现出色。
- 用户可通过网页UI直观切换至Deep Think模式,功能将逐步向更多用户开放。
- 在正式发布前,Google通过API收集反馈并进行安全评估,确保功能的稳定性和数据安全性。
13. **谷歌地图迎来超大规模升级**
- 使用生成式AI搜索功能,通过自然语言实现精准地点查询。
- 智能评论分析功能,自动总结用户评论并解答关于地点的具体问题。
- 推出节油路线优化功能,结合多因素分析推荐更环保的行驶路线。
空空如也
暂无小宇宙热门评论