【视频生成】快手可灵2.1推出全新首尾帧功能
* 新增首尾帧功能,提升视频开头和结尾的精细控制
* 支持自定义首尾帧图像,解决转场生硬问题
* 生成速度和成本下降,提高创作者使用效率
【AI音乐】昆仑万维上线AI音乐模型Mureka V7.5
* 在中文歌曲创作中展现卓越能力,包括音色、咬字和情感表现
* 结合MoE-TTS语音合成框架,通过自然语言精准控制声音特征
* 为AI音乐创作和语音合成领域提供了新思路
【AI开发工具】腾讯云推出CloudBase AI CLI,可减少80%编码量
* 提供统一的命令行入口,简化开发流程
* 支持全平台通用性和多模型协作能力
* 提供免费体验额度,降低使用门槛
详情链接: https://static.cloudbase.net/cli/install/install.sh -fsS | bash
【AI Agent】海外新品MuleRun爆火,AI Agent自动玩游戏做建模
* Al Agent能够自动完成游戏任务,极大提升用户体验
* 为用户提供专属的虚拟机环境,支持运行多种软件和应用
* 社区驱动的Agent生态降低了自动化工具的使用门槛
详情链接: https://discord.com/invite/kKAAEYay5F
【AI视觉】Meta重磅开源DINOv3,无需人工标注
* 基于自监督学习,无需人工标注,从海量图像中自主提取特征
* 高分辨率特征提取,同时捕捉全局信息与局部细节
* 适用于环境监测、医疗、自动驾驶等跨领域应用
详情链接: https://github.com/facebookresearch/dinov3
【人形机器人】宇树H1夺机器人史首枚1500米金牌
* 在全球首个以人形机器人为核心的竞技赛事中夺得历史首枚1500米赛金牌
* 在软件上针对跑步速度与耐力进行了优化升级,展现了极限性能
【AI助手】谷歌Gemini迎来重大更新,新增记忆功能和隐私聊天模式
* 记忆功能可记录用户偏好和习惯,提升个性化服务体验
* 临时聊天模式保障隐私,对话内容不会被保存或用于训练
* 体现了AI助手在个性化与隐私保护上的双重突破
【开源项目】香港大学联手开源项目OpenCUA,打造个性化电脑智能助手
* 提供无缝的注释基础设施,用于捕捉人类在电脑上的操作演示
* 集成了AgentNet数据集,覆盖超200个应用程序和网站
* 支持可扩展的工作流程,提升长链推理能力
详情链接: https://opencua.xlang.ai/
【行业动态】OpenAI或在ChatGPT引入广告
* 正探索在ChatGPT中引入广告,但需谨慎处理以确保用户体验
* 高管认为订阅模式仍有巨大增长潜力
* 预计2024年订阅收入将达127亿美元
【AI模型】谷歌发布超小型开源AI模型Gemma 3 270M
* 拥有2.7亿参数的开源模型,适合在智能手机上离线运行
* 在指令跟随任务中表现出色,能效高
* 支持快速微调,适用于企业开发和创造性应用
详情链接: https://developers.googleblog.com/en/introducing-gemma-3-270m/
空空如也
暂无小宇宙热门评论