【技术突破】 🚀 字节 OmniHuman-1.5 发布:一张图+音频生成超真实视频
单张图像联动音频,生成高拟真动态视频,动作协调与表现力显著提升。
支持双人音频驱动、情感感知与多风格覆盖,适配演讲、MV、虚拟主播等场景。
- 项目链接:https://omnihuman-lab.github.io/v1_5/
【行业动态】 📈 PixVerse V5 全球同步上线,用户规模破亿
V5 在复杂运动、动漫同人、广告与艺术表达等场景表现出色。
图生视频项目全球 Top2、文生视频 Top3,进一步降低创作门槛。
【开源项目】 🧩 腾讯 Youtu-agent:几句 YAML 搭建会上网的智能体
在 WebWalkerQA 与 GAIA 基准分别达 71.47% 和 72.8%,全异步执行性能强。
支持 CSV 分析、文献综述、文件整理等,多工具集与自动化配置开箱即用。
- 项目链接:https://github.com/Tencent/Youtu-agent
【效率工具】 🧰 Plaud AI Pro 录音笔发布:50 小时续航 + 智能屏
0.95 英寸 AMOLED 实时显示录音与电量,四麦克风带来更广拾音与更优降噪。
更长续航与更智能交互,重塑会议与课堂笔记工作流。
【技术突破】 ⚙️ 百度百舸 AI 计算平台 5.0 发布
网络通信提速降延迟,上线昆仑芯超节点,提供更强算力。
训推一体引入强化学习框架,进一步压榨资源与提升效率。
【行业动态】 📰 OpenAI 将上线家长监控与危机干预能力
针对青少年安全引入家长监控、紧急联系人联动与危机场景主动干预。
GPT-5 方向更新以强化识别与干预能力,回应相关诉讼与社会关切。
【效率工具】 💻 Claude Code 网页版上线:无需 CLI,云端即用
基于 Claude 3.7 Sonnet,支持自然语言写码、调试与项目管理。
浏览器一键访问,强化数据安全与隐私保护,降低团队接入门槛。
【行业动态】 📊 IDC:未来五年全球 ICT 市场达 7.6 万亿美元
预计五年复合增速 7.0%,AI 与算力需求成核心驱动力。
中国企业级 ICT 2025 年达 3147 亿美元,软件与信息服务持续攀升。
【开源项目】 🧩 腾讯混元 HunyuanVideo-Foley:端到端视频音效生成开源
构建大规模 TV2A 数据集,双流多模态扩散变换器平衡文本与视频语义。
引入 REPA 损失,生成电影级匹配音效,显著提升质量与稳定性。
- 项目链接:https://hunyuan.tencent.com/video/zh?tabIndex=0
【行业动态】 🌍 a16z 移动端 AI 榜单:中国团队强势登顶多赛道
中国团队在图片与视频处理占据优势,美图 5 款产品上榜。
生态加速完善,新兴平台崛起,移动端 AI 产品全球竞争力走强。
空空如也
暂无小宇宙热门评论