【AI模型】 🗣️ 字节跳动发布同声传译模型 Seed LiveInterpret 2.0
* 中英同传翻译质量达业界顶尖水平
* 具备低延迟(仅需3秒)和实时声音复刻功能
* 显著提升跨语言交流的自然度和流畅性
详情链接: https://arxiv.org/pdf/2507.17527
【AI应用】 🔎 秘塔搜索 API 上线
* 定价0.03元/查询,为开发者提供Bing Search API的替代方案
* 支持多模态搜索能力
* 无使用门槛,开发者可即测即用,提升接入效率
【设计工具】 🎨 Lovart AI 正式版全球发布
* 首个人工智能设计 Agent,通过自然语言交互和全链路设计能力重塑创作体验
* 新功能 ChatCanvas 支持多轮对话和实时调整布局、配色
* 针对中国市场优化“星流 Agent”,支持中文语义和国风审美
【AI模型】 🎤 李沐团队发布 Higgs Audio v2,开创语音合成新纪元
* 基于1000万小时语音数据训练,成为行业新标杆
* 支持多语言对话生成、声音克隆及韵律自动调整
* 适用于虚拟主播、语音助手等实时语音聊天和音频内容创作场景
【行业动态】 🎬 Sora2浮出水面:OpenAI 欲在生成式AI视频领域重夺C位
* OpenAI 正在积极开发 Sora2,以应对谷歌Veo3的竞争
* Sora2 尚未公开发布,但未来几周内可能有更多消息
* 竞争对手谷歌Veo3已向大学生免费开放
【行业动态】 🏗️ OpenAI与Oracle携手扩展Stargate项目
* 项目容量将扩大至超过5吉瓦,目标是到2029年实现10吉瓦
* 预计将创造超10万个工作岗位,推动美国AI发展
* 项目已获得超过190亿美元的资金支持
【AI功能】 🖼️ Google Photos新增AI功能:照片秒变动漫、一键生成视频
* 利用Veo2模型,可将静态照片轻松转为6秒动态视频
* Remix功能由Imagen AI驱动,支持将照片转换为动漫、漫画等多种艺术风格
* 新增“创建”标签页,整合多种创意工具,提供一站式创作体验
【AI功能】 ✨ YouTube Shorts将推全新AI 特效 照片秒变视频
* 图片转视频功能可让静态照片在6秒内生成视频,提升短视频创作效率
* AI 特效可将涂鸦、自拍等简单素材转化为精美艺术作品
* 新一代Veo3视频生成器将同步生成音频,提供更完整的创作方案
【AI模型】 📜 谷歌推出 Aeneas 模型:为古代文本解读开辟新路径
* 由谷歌DeepMind推出,旨在帮助历史学家解读古代铭文
* 能够分析古代文本的相似性,填补文本空白,减轻历史研究者的负担
* 将文本转化为“历史指纹”,帮助历史学家在更广泛的背景下解读铭文
详情链接: https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/
【开发工具】 💻 GitHub Spark横空出世:一句话打造Web应用
* 允许用户通过自然语言描述需求,快速生成完整的Web应用
* 提供全托管运行环境,支持一键部署和PWA适配,简化开发流程
* 与GitHub生态深度整合,支持多模型选择,提升开发效率
详情链接: https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-copilot-pro-subscribers/
【硬件产品】 ✒️ 华为M-Pencil Pro发布
* 定价699元,具备16384级压感和侧旋功能,提升创作真实感
* 笔尾智慧键可一键唤起小艺智能助手,提升操作便捷性
* 支持星闪精确查找功能,精确定位50米范围内的手写笔
空空如也
暂无小宇宙热门评论