Album
时长:
7分钟
播放:
130
发布:
5个月前
主播...
简介...
https://xiaoyuzhoufm.com

### AI日报



#### 1. 腾讯元宝升级:一句话搜索图片视频


腾讯元宝迎来重大更新,用户只需一句话提问即可获得图文并茂的回答。无论是学习新技能还是解决生活难题都变得更加简单。


- **一句话搜索**:智能匹配图片和视频号内容


- **直观学习**:提供手把手教学体验


- **生活助手**:轻松解决生活小问题



#### 2. 微信支付MCP上线:AI与支付的完美结合


微信支付推出MCP功能,为AI应用提供了新的盈利渠道,并通过数据闭环提升了商业效率。


- **新盈利渠道**:用户可通过支付直接完成服务获取


- **数据闭环**:商家能实时调整服务内容和价格以优化ROI


- **提升价值**:交易数据成为AI优化服务的来源,创造更多盈利机会


详情链接: [https://yuanqi.tencent.com/mcp-shop](https://yuanqi.tencent.com/mcp-shop)



#### 3. 谷歌Veo3视频生成模型向Pro/Ultra会员开放


谷歌最新一代AI文生视频模型Veo3已向Google AI Pro和Ultra会员开放,支持高清画质、音画同步能力和多模态创作功能。


- **高清视频**:支持1080p高清视频,内部测试可达4K分辨率


- **音画同步**:自动生成环境音效、角色对白和背景音乐


- **多输入支持**:支持文字或图像输入生成视频,适用于复杂提示词指令和多镜头叙事


计划新增“照片生成视频”功能。



#### 4. 开源DeepSeek R1增强版:推理效率提升200%


DeepSeek-TNG-R1T2-Chimera采用创新AoE架构,提升了推理性能并节省了token输出。


- **性能提升**:AoE架构优化MoE模型,提升推理性能


- **测试表现**:在MTBench和AIME-2024测试中表现优于普通R1版本


- **成本降低**:权重合并与优化技术显著降低模型复杂性和计算成本


详情链接: [https://huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera](https://huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera)



#### 5. 美图WHEE推出“一句话修图”功能


美图WHEE推出的“一句话修图”功能,让用户通过简单的语音指令即可完成复杂的修图操作。


- **简单修图**:通过一句话实现修图效果


- **多种风格**:支持未来感、怀旧文艺范等多种风格切换


- **文字处理**:可以添加或去除文字,精准处理照片中的文字内容



#### 6. Ambiq Micro申请美国IPO


Ambiq Micro在2024年实现了16.1%的净销售额增长,尽管仍处于亏损状态,但其在超低功耗半导体领域的技术优势使其在边缘AI市场占据有利地位。


- **销售增长**:2024年净销售额增长16.1%,达到7610万美元


- **亏损情况**:2024年亏损3970万美元,面临客户集中风险


- **市场定位**:专注于超低功耗半导体,目标是“边缘AI”市场



#### 7. 昆仑万维再次开源奖励模型Skywork-Reward-V2


昆仑万维开源了第二代奖励模型Skywork-Reward-V2系列,涵盖8个不同参数规模的模型,在多个主流评测榜单中取得最优成绩。


- **模型系列**:包含8个模型,参数从6亿到80亿不等


- **数据集**:构建了4000万对偏好对比的数据集,采用人机协同两阶段流程提升数据质量


- **评估表现**:在多个评估基准上表现优异,尤其在通用偏好、正确性及高级能力测试中领先


详情链接: [https://huggingface.co/collections/Skywork/skywork-reward-v2-685cc86ce5d9c9e4be500c84](https://huggingface.co/collections/Skywork/skywork-reward-v2-685cc86ce5d9c9e4be500c84)



#### 8. Kyutai TTS发布:超低延迟语音合成


Kyutai TTS的发布标志着开源AI语音技术迈入新阶段,其超低延迟、高精度语音输出及多语言支持为开发者提供了强大的工具。


- **低延迟**:支持文本流式传输,延迟低至350毫秒


- **高精度**:英语和法语的词错误率分别低至2.82和3.29


- **开源模式**:允许自由使用、修改和分发,推动全球AI社区创新与技术进步


详情链接: [https://kyutai.org/next/tts](https://kyutai.org/next/tts)



#### 9. Figma拟以约200亿美元估值登陆纽交所


Figma拟以200亿美元估值登陆纽交所,凭借其财务稳健性、技术创新和市场扩展战略,展现了强大的增长潜力。


- **上市计划**:计划以约200亿美元估值在纽交所上市


- **财务表现**:2024年收入达7.49亿美元,拥有15.4亿美元现金储备


- **AI布局**:积极布局AI技术,推出Figma Make等工具,未来将整合生成式AI优化设计流程



#### 10. 字节跳动开源Trae-Agent


字节跳动开源Trae-Agent,提升编程效率,支持多语言模型,提供强大开发工具。


- **多模型支持**:兼容OpenAI等多种语言模型


- **功能集成**:内置文件编辑和脚本执行,支持复杂编程场景


- **日志记录**:自动保存操作日志,提升开发透明度与调试便利性


产品链接: [https://github.com/trae-agent](https://github.com/trae-agent)

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧