【AI日报】
1. **Kimi开源视觉语言模型Kimi-VL与Kimi-VL-Thinking**
- Moonshot AI最近开源了Kimi-VL和Kimi-VL-Thinking两款视觉语言模型,参数仅有30亿,但在多个基准测试中超越了GPT-4o。
- 支持高达128K tokens的上下文输入,适用于长文档和视频分析。
- 详情链接: https://github.com/MoonshotAI/Kimi-VL, https://huggingface.co/moonshotai/Kimi-VL-A3B-Instruct
2. **科大讯飞旗下讯飞星辰Agent开发平台全面支持MCP**
- 讯飞星辰Agent开发平台全面支持MCP,帮助开发者高效构建Agent应用。
- 首批支持20+行业精品MCP Server,涵盖AI能力、生活服务等多个领域。
- 详情链接: https://mcp.xfyun.cn/
3. **昆仑万维开源Skywork-OR1系列模型**
- 昆仑万维天工团队推出Skywork-OR1系列模型,包括三款高性能模型,分别针对数学和代码领域。
- Skywork-OR1-32B-Preview在竞赛编程任务中表现尤为突出。
- 详情链接: https://github.com/SkyworkAI/Skywork-OR1
4. **字节跳动推出Seed-Thinking-v1.5**
- 字节跳动推出的新型大语言模型Seed-Thinking-v1.5在推理AI竞争中表现出色,特别是在STEM领域。
- 采用混合专家架构,在多项基准测试中超越行业巨头。
5. **商汤大装置SenseCore2.0全新升级**
- 商汤科技宣布其大装置SenseCore2.0全面升级,提升算力利用率和推理性能。
- 投入1亿元专项代金券,助力各行业加速AI落地。
6. **Google AI Studio开放Veo2视频模型有限免费试用**
- Google AI Studio向部分用户开放了Veo2视频模型的有限免费试用,支持高达4K分辨率。
- 用户反馈冷却时间不明确,可能影响体验。
7. **上海AI实验室开源InternVL3系列多模态大型语言模型**
- OpenGVLab发布InternVL3系列模型,支持从1B到78B的多种尺寸,具备处理文字、图片、视频等多种信息的能力。
- 模型可通过LMDeploy的api_server部署为OpenAI兼容API。
- 详情链接: https://modelscope.cn/collections/InternVL3-5d0bdc54b7d84e
8. **全新GAIA基准超越ARC-AGI**
- 新推出的GAIA基准通过模拟真实世界的复杂问题,评估AI在实际应用中的能力。
- 初步结果显示,灵活性强的模型在复杂任务中表现优于其他知名模型。
- 详情链接: https://huggingface.co/gaia-benchmark
9. **百元成本炼成开源视频模型Pusa**
- Pusa基于Mochi微调,训练成本仅为100美元,支持多种视频生成任务。
- 完全开源,提供完整的代码库和训练方法。
- 详情链接: https://top.aibase.com/tool/pusa
10. **字节跳动开源项目UNO**
- UNO解决了AI图像生成中的角色一致性问题,确保生成图像的一致性。
- 采用高一致性数据合成流程和创新模型设计。
- 详情链接: https://huggingface.co/bytedance-research/UNO
11. **小鹏汽车推新物理大模型**
- 小鹏汽车定位为AI汽车公司,引入强化学习与模型蒸馏技术,提升自动驾驶领域的竞争力。
- 2025年发布会将解答小鹏未来发展方向,推出新车型X9。
12. **字节跳动布局AI智能眼镜**
- 字节跳动研发AI智能眼镜,集成“豆包”AI模型,支持语音指令、实时翻译等智能交互。
- 项目已进入实质性研发阶段,计划与供应链伙伴沟通,推动产品设计与上市。
- 详情链接: 无
空空如也
暂无小宇宙热门评论