【AI语音】 🎤 阶跃发布Step-Audio 2 mini
* 真端到端语音大模型,SOTA表现
* 融合链式思维推理+强化学习
* 优化情绪、语调等副语言理解
详情链接:https://github.com/stepfun-ai/Step-Audio2
【AI内容新规】 ⚖ 9月1日正式生效
* 强制AI生成内容显式+隐式标识
* 违规将面临限流、整改、下架及法律风险
【开源大模型】 🐱 美团LongCat发布
* 560亿参数,MoE架构
* 推理性能超100 tokens/s
* MMLU、数学推理等任务表现优异
详情链接:https://longcat.chat/
【多模态AI】 🖼️ 上海AI实验室InternVL3.5
* 级联式强化学习+视觉分辨率路由
* 推理与通用性能超越GPT-5、Claude-3.7
详情链接:https://github.com/OpenGVLab/InternVL
【音频生成】 🎧 腾讯ARC AudioStory
* 大语言模型驱动长篇叙事音频
* 结构化生成,音质与一致性俱佳
详情链接:https://github.com/TencentARC/AudioStory
【语音AI】 🔥 OpenAI GPT-realtime
* 实现自然流畅人机语音对话
* 多模态处理+语音风格切换
【推理优化】 📊 Meta&UCSD DeepConf
* 准确率99.9%,成本降低85%
* “置信度”机制动态优化推理
详情链接:https://arxiv.org/abs/2508.15260
【科技事件】 🚨 Musk确认xAI代码被盗
* 前员工Xuechen Li转投OpenAI
* 涉及商业机密与巨额利益
【GUI自动化】 📱 阿里巴巴Qwen团队
* Mobile-Agent-v3 & GUI-Owl发布
* 多代理协作+多模态推理,提升GUI任务执行力
详情链接:https://arxiv.org/abs/2508.15144
【微软AI】 💡 Copilot Labs上线
* 首个实验工具“Copilot音频表达”
* 文本转语音,支持情感+故事模式
详情链接:https://copilot.microsoft.com/labs/experiments/audio-expression
【内容创作】 📝 小红书自动化工具xiaohongshu-mcp
* 支持自动化登录、图文发布、数据获取
* 基于Go语言,开发者友好,支持二次开发
详情链接:https://github.com/xpzouying/xiaohongshu-mcp
空空如也
暂无小宇宙热门评论