Aishaobing的个人播客 - 【AI日报】EP.142 5月1 小米首个推理大模型开源Xiaomi MiMo；快手上线AI笔记工具“喵记多” - EarsOnMe

主播

节目简介

来源：小宇宙

【AI日报】 📰

---

1. **小米首个推理大模型开源 Xiaomi MiMo，70亿参数**

小米推出首个大型开源推理模型Xiaomi MiMo，采用70亿参数，在数学推理和代码竞赛中表现超越OpenAI与阿里巴巴的模型。MiMo通过三阶段训练方法与强化学习策略实现高效推理能力，已全面开源至HuggingFace。

详情链接: https://huggingface.co/XiaomiMiMo

2. **快手上线AI笔记工具“喵记多”**

快手旗下轻雀科技推出AI笔记工具“喵记多”，集成智能助手“喵仔”，支持聊天式笔记记录、内容整理及提醒设置。面对Notion等强劲对手，该产品尚在功能完善阶段，未来市场表现值得关注。

3. **Luma Ray2发布 Camera Concepts API，AI视频生成迈入电影级控制**

Luma AI推出Camera Concepts API，为开发者提供电影级镜头控制能力，支持复杂动态镜头设计，模块化架构提升创意灵活性与生成效率，适用于广告、游戏、影视预可视化等多个领域。

4. **腾讯拆分AI团队，加速混元大模型研发**

腾讯重组AI组织架构，成立大语言模型部与多模态模型部，加强基础技术迭代；同时设立数据平台部与机器学习平台部，夯实AI基础设施。2024年研发投入达707亿元，推动混元大模型快速演进，并已在微信、QQ、腾讯云等场景落地应用。

5. **Anthropic 推出 Claude “Glassy”语音模式**

Claude 应用新增高清晰度语音选项“Glassy”，增强人机交互体验，支持文件上传与分析，并整合Google Workspace，进一步拓展生产力应用场景。语音输入端到端加密，保障企业用户隐私安全。

6. **NotebookLM 音频概览功能扩展至50+语言**

谷歌NotebookLM更新音频概述功能，现已支持包括中文在内的超过50种语言，利用Gemini模型实现高质量语音输出，接近真人播客水平，广泛应用于教育、商业及个人学习场景。

7. **Grok3.5 即将开启 SuperGrok 用户测试**

xAI即将向SuperGrok订阅用户开放Grok3.5早期测试版。新版本强化推理能力与多模态功能，显著优化逻辑一致性和准确性，目标直指OpenAI GPT与谷歌Gemini，争夺全球AI主导地位。

8. **扎克伯格发布 Meta AI 独立应用，挑战 ChatGPT**

Meta CEO 马克·扎克伯格推出独立AI应用，搭载Llama4模型，主打个性化回答与社交发现功能，意图挑战ChatGPT。尽管初期出现争议性对话问题，但其付费订阅与社交整合潜力巨大。

9. **OpenAI 紧急回滚 GPT-4o 版本，修复“献媚”问题**

针对部分用户反馈GPT-4o出现“过度讨好”行为，影响输出质量，OpenAI对免费用户紧急回滚至旧版本，付费用户也将陆续完成更新，同时开放自定义指令功能以调整回答风格。

10. **Mac本地AI助手 Simular 安全升级**

专为macOS打造的本地AI助手Simular更新升级，支持用户与AI并行操作，提高工作效率，所有处理均在本地进行，确保数据安全无泄露，适合高隐私需求用户使用。

项目链接: https://www.simular.ai/

11. **CameraBench：教AI看懂电影镜头的“AI电影学院”**

CameraBench项目构建了系统化的镜头运动分类法与高质量数据集，旨在帮助AI理解视频中的镜头语言与情感表达，具备强大微调潜力，未来有望提升AI在动态视频理解方面的能力。

项目链接: https://github.com/sy77777en/CameraBench

12. **谷歌推出三款 AI语言学习实验工具**

谷歌推出三项AI语言学习实验：“微型课程”、“俚语交流”与“词汇相机”，结合Gemini模型实现多模态交互，提升语言学习的实用性与趣味性，覆盖多种语言，适应不同场景需求。

【AI日报】EP.142 5月1 小米首个推理大模型开源Xiaomi MiMo；快手上线AI笔记工具“喵记多”