Album
时长:
5分钟
播放:
118
发布:
3个月前
主播...
简介...
https://xiaoyuzhoufm.com

【AI语音】 🎤 阶跃发布Step-Audio 2 mini


* 真端到端语音大模型,SOTA表现


* 融合链式思维推理+强化学习


* 优化情绪、语调等副语言理解


详情链接:https://github.com/stepfun-ai/Step-Audio2



【AI内容新规】 ⚖ 9月1日正式生效


* 强制AI生成内容显式+隐式标识


* 违规将面临限流、整改、下架及法律风险



【开源大模型】 🐱 美团LongCat发布


* 560亿参数,MoE架构


* 推理性能超100 tokens/s


* MMLU、数学推理等任务表现优异


详情链接:https://longcat.chat/



【多模态AI】 🖼️ 上海AI实验室InternVL3.5


* 级联式强化学习+视觉分辨率路由


* 推理与通用性能超越GPT-5、Claude-3.7


详情链接:https://github.com/OpenGVLab/InternVL



【音频生成】 🎧 腾讯ARC AudioStory


* 大语言模型驱动长篇叙事音频


* 结构化生成,音质与一致性俱佳


详情链接:https://github.com/TencentARC/AudioStory



【语音AI】 🔥 OpenAI GPT-realtime


* 实现自然流畅人机语音对话


* 多模态处理+语音风格切换



【推理优化】 📊 Meta&UCSD DeepConf


* 准确率99.9%,成本降低85%


* “置信度”机制动态优化推理


详情链接:https://arxiv.org/abs/2508.15260



【科技事件】 🚨 Musk确认xAI代码被盗


* 前员工Xuechen Li转投OpenAI


* 涉及商业机密与巨额利益



【GUI自动化】 📱 阿里巴巴Qwen团队


* Mobile-Agent-v3 & GUI-Owl发布


* 多代理协作+多模态推理,提升GUI任务执行力


详情链接:https://arxiv.org/abs/2508.15144



【微软AI】 💡 Copilot Labs上线


* 首个实验工具“Copilot音频表达”


* 文本转语音,支持情感+故事模式


详情链接:https://copilot.microsoft.com/labs/experiments/audio-expression



【内容创作】 📝 小红书自动化工具xiaohongshu-mcp


* 支持自动化登录、图文发布、数据获取


* 基于Go语言,开发者友好,支持二次开发


详情链接:https://github.com/xpzouying/xiaohongshu-mcp

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧