Album
时长:
7分钟
播放:
89
发布:
3个月前
主播...
简介...
https://xiaoyuzhoufm.com

【技术突破】 🚀 字节 OmniHuman-1.5 发布:一张图+音频生成超真实视频


单张图像联动音频,生成高拟真动态视频,动作协调与表现力显著提升。


支持双人音频驱动、情感感知与多风格覆盖,适配演讲、MV、虚拟主播等场景。


- 项目链接:https://omnihuman-lab.github.io/v1_5/



【行业动态】 📈 PixVerse V5 全球同步上线,用户规模破亿


V5 在复杂运动、动漫同人、广告与艺术表达等场景表现出色。


图生视频项目全球 Top2、文生视频 Top3,进一步降低创作门槛。



【开源项目】 🧩 腾讯 Youtu-agent:几句 YAML 搭建会上网的智能体


在 WebWalkerQA 与 GAIA 基准分别达 71.47% 和 72.8%,全异步执行性能强。


支持 CSV 分析、文献综述、文件整理等,多工具集与自动化配置开箱即用。


- 项目链接:https://github.com/Tencent/Youtu-agent



【效率工具】 🧰 Plaud AI Pro 录音笔发布:50 小时续航 + 智能屏


0.95 英寸 AMOLED 实时显示录音与电量,四麦克风带来更广拾音与更优降噪。


更长续航与更智能交互,重塑会议与课堂笔记工作流。



【技术突破】 ⚙️ 百度百舸 AI 计算平台 5.0 发布


网络通信提速降延迟,上线昆仑芯超节点,提供更强算力。


训推一体引入强化学习框架,进一步压榨资源与提升效率。



【行业动态】 📰 OpenAI 将上线家长监控与危机干预能力


针对青少年安全引入家长监控、紧急联系人联动与危机场景主动干预。


GPT-5 方向更新以强化识别与干预能力,回应相关诉讼与社会关切。



【效率工具】 💻 Claude Code 网页版上线:无需 CLI,云端即用


基于 Claude 3.7 Sonnet,支持自然语言写码、调试与项目管理。


浏览器一键访问,强化数据安全与隐私保护,降低团队接入门槛。



【行业动态】 📊 IDC:未来五年全球 ICT 市场达 7.6 万亿美元


预计五年复合增速 7.0%,AI 与算力需求成核心驱动力。


中国企业级 ICT 2025 年达 3147 亿美元,软件与信息服务持续攀升。



【开源项目】 🧩 腾讯混元 HunyuanVideo-Foley:端到端视频音效生成开源


构建大规模 TV2A 数据集,双流多模态扩散变换器平衡文本与视频语义。


引入 REPA 损失,生成电影级匹配音效,显著提升质量与稳定性。


- 项目链接:https://hunyuan.tencent.com/video/zh?tabIndex=0



【行业动态】 🌍 a16z 移动端 AI 榜单:中国团队强势登顶多赛道


中国团队在图片与视频处理占据优势,美图 5 款产品上榜。


生态加速完善,新兴平台崛起,移动端 AI 产品全球竞争力走强。

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧