Aishaobing的个人播客 - 【AI日报】EP.198 8月16 可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型Mureka V7.5 - EarsOnMe

主播

Aishaobing 1 档播客

节目简介

来源：小宇宙

【视频生成】快手可灵2.1推出全新首尾帧功能

* 新增首尾帧功能，提升视频开头和结尾的精细控制

* 支持自定义首尾帧图像，解决转场生硬问题

* 生成速度和成本下降，提高创作者使用效率

【AI音乐】昆仑万维上线AI音乐模型Mureka V7.5

* 在中文歌曲创作中展现卓越能力，包括音色、咬字和情感表现

* 结合MoE-TTS语音合成框架，通过自然语言精准控制声音特征

* 为AI音乐创作和语音合成领域提供了新思路

【AI开发工具】腾讯云推出CloudBase AI CLI，可减少80%编码量

* 提供统一的命令行入口，简化开发流程

* 支持全平台通用性和多模型协作能力

* 提供免费体验额度，降低使用门槛

详情链接: https://static.cloudbase.net/cli/install/install.sh -fsS | bash

【AI Agent】海外新品MuleRun爆火，AI Agent自动玩游戏做建模

* Al Agent能够自动完成游戏任务，极大提升用户体验

* 为用户提供专属的虚拟机环境，支持运行多种软件和应用

* 社区驱动的Agent生态降低了自动化工具的使用门槛

详情链接: https://discord.com/invite/kKAAEYay5F

【AI视觉】Meta重磅开源DINOv3，无需人工标注

* 基于自监督学习，无需人工标注，从海量图像中自主提取特征

* 高分辨率特征提取，同时捕捉全局信息与局部细节

* 适用于环境监测、医疗、自动驾驶等跨领域应用

详情链接: https://github.com/facebookresearch/dinov3

【人形机器人】宇树H1夺机器人史首枚1500米金牌

* 在全球首个以人形机器人为核心的竞技赛事中夺得历史首枚1500米赛金牌

* 在软件上针对跑步速度与耐力进行了优化升级，展现了极限性能

【AI助手】谷歌Gemini迎来重大更新，新增记忆功能和隐私聊天模式

* 记忆功能可记录用户偏好和习惯，提升个性化服务体验

* 临时聊天模式保障隐私，对话内容不会被保存或用于训练

* 体现了AI助手在个性化与隐私保护上的双重突破

【开源项目】香港大学联手开源项目OpenCUA，打造个性化电脑智能助手

* 提供无缝的注释基础设施，用于捕捉人类在电脑上的操作演示

* 集成了AgentNet数据集，覆盖超200个应用程序和网站

* 支持可扩展的工作流程，提升长链推理能力

详情链接: https://opencua.xlang.ai/

【行业动态】OpenAI或在ChatGPT引入广告

* 正探索在ChatGPT中引入广告，但需谨慎处理以确保用户体验

* 高管认为订阅模式仍有巨大增长潜力

* 预计2024年订阅收入将达127亿美元

【AI模型】谷歌发布超小型开源AI模型Gemma 3 270M

* 拥有2.7亿参数的开源模型，适合在智能手机上离线运行

* 在指令跟随任务中表现出色，能效高

* 支持快速微调，适用于企业开发和创造性应用

详情链接: https://developers.googleblog.com/en/introducing-gemma-3-270m/

【AI日报】EP.198 8月16 可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型Mureka V7.5

加入我们的 Discord

扫描微信二维码

播放列表