【AI日报】 📰
---
1. **小米首个推理大模型开源 Xiaomi MiMo,70亿参数**
小米推出首个大型开源推理模型Xiaomi MiMo,采用70亿参数,在数学推理和代码竞赛中表现超越OpenAI与阿里巴巴的模型。MiMo通过三阶段训练方法与强化学习策略实现高效推理能力,已全面开源至HuggingFace。
详情链接: https://huggingface.co/XiaomiMiMo
2. **快手上线AI笔记工具“喵记多”**
快手旗下轻雀科技推出AI笔记工具“喵记多”,集成智能助手“喵仔”,支持聊天式笔记记录、内容整理及提醒设置。面对Notion等强劲对手,该产品尚在功能完善阶段,未来市场表现值得关注。
3. **Luma Ray2发布 Camera Concepts API,AI视频生成迈入电影级控制**
Luma AI推出Camera Concepts API,为开发者提供电影级镜头控制能力,支持复杂动态镜头设计,模块化架构提升创意灵活性与生成效率,适用于广告、游戏、影视预可视化等多个领域。
4. **腾讯拆分AI团队,加速混元大模型研发**
腾讯重组AI组织架构,成立大语言模型部与多模态模型部,加强基础技术迭代;同时设立数据平台部与机器学习平台部,夯实AI基础设施。2024年研发投入达707亿元,推动混元大模型快速演进,并已在微信、QQ、腾讯云等场景落地应用。
5. **Anthropic 推出 Claude “Glassy”语音模式**
Claude 应用新增高清晰度语音选项“Glassy”,增强人机交互体验,支持文件上传与分析,并整合Google Workspace,进一步拓展生产力应用场景。语音输入端到端加密,保障企业用户隐私安全。
6. **NotebookLM 音频概览功能扩展至50+语言**
谷歌NotebookLM更新音频概述功能,现已支持包括中文在内的超过50种语言,利用Gemini模型实现高质量语音输出,接近真人播客水平,广泛应用于教育、商业及个人学习场景。
7. **Grok3.5 即将开启 SuperGrok 用户测试**
xAI即将向SuperGrok订阅用户开放Grok3.5早期测试版。新版本强化推理能力与多模态功能,显著优化逻辑一致性和准确性,目标直指OpenAI GPT与谷歌Gemini,争夺全球AI主导地位。
8. **扎克伯格发布 Meta AI 独立应用,挑战 ChatGPT**
Meta CEO 马克·扎克伯格推出独立AI应用,搭载Llama4模型,主打个性化回答与社交发现功能,意图挑战ChatGPT。尽管初期出现争议性对话问题,但其付费订阅与社交整合潜力巨大。
9. **OpenAI 紧急回滚 GPT-4o 版本,修复“献媚”问题**
针对部分用户反馈GPT-4o出现“过度讨好”行为,影响输出质量,OpenAI对免费用户紧急回滚至旧版本,付费用户也将陆续完成更新,同时开放自定义指令功能以调整回答风格。
10. **Mac本地AI助手 Simular 安全升级**
专为macOS打造的本地AI助手Simular更新升级,支持用户与AI并行操作,提高工作效率,所有处理均在本地进行,确保数据安全无泄露,适合高隐私需求用户使用。
项目链接: https://www.simular.ai/
11. **CameraBench:教AI看懂电影镜头的“AI电影学院”**
CameraBench项目构建了系统化的镜头运动分类法与高质量数据集,旨在帮助AI理解视频中的镜头语言与情感表达,具备强大微调潜力,未来有望提升AI在动态视频理解方面的能力。
项目链接: https://github.com/sy77777en/CameraBench
12. **谷歌推出三款 AI语言学习实验工具**
谷歌推出三项AI语言学习实验:“微型课程”、“俚语交流”与“词汇相机”,结合Gemini模型实现多模态交互,提升语言学习的实用性与趣味性,覆盖多种语言,适应不同场景需求。
空空如也
暂无小宇宙热门评论