Album
时长:
7分钟
播放:
112
发布:
3个月前
主播...
简介...
https://xiaoyuzhoufm.com

【开源项目】 🧩 腾讯开源超长程世界模型 HunyuanWorld‑Voyager,原生3D重建登场


基于单张图像生成世界一致性的3D点云并支持沉浸式探索。


视频生成与场景重建效果领先,面向VR、游戏与空间智能。


- 参考链接:https://upload.chinaz.com/video/2025/0902/6389242348453431527577699.mp4



【开源项目】 🧩 通义实验室发布 AgentScope 1.0,多智能体开发一体化框架


三层架构(Core、Runtime、Studio)覆盖开发、部署、监控全生命周期。


支持实时介入控制、智能上下文管理与高效工具调用,强化安全与稳定。


- 项目链接:https://github.com/agentscope-ai/agentscope



【行业动态】 📰 即梦AI开放图像与视频生成API,一站式创作加速企业落地


与火山引擎开放API,覆盖文生图3.0/3.1、视频生成3.0pro与动作模仿等。


助力企业高效生产创意内容,加速商业应用创新。



【AI模型】 🧠 腾讯开源 Hunyuan‑MT‑7B,WMT2025 30项夺冠


支持31种语言,在多语种基准中强势夺魁。


开源推动多语言NLP应用普及与合作。



【技术突破】 🚀 苹果推出 STARFlow,图像生成架构对标 DALL‑E 与 Midjourney


将正则化流与自回归Transformer结合,提升高分辨率生成效率与质量。


深浅设计与潜在空间操作进一步优化模型表现,前景广阔。


- 参考链接:https://arxiv.org/pdf/2506.06276



【效率工具】 ⚙️ 苹果 FastVLM 上线,85倍速本地视觉AI可5分钟上手


在Apple Silicon设备近乎即时处理图像与字幕,视频字幕速度提升85倍、体积缩小3倍以上。


可浏览器直载轻量版,数据全程本地确保隐私。



【AI模型】 🧠 CoMPaSS‑FLUX.1 发布,显著强化文本到图像的空间理解


基于FLUX.1的LoRA适配器,显著提升物体间空间关系理解。


多项基准全面提升,同时保持高质量生成。


- 项目链接:https://huggingface.co/blurgy/CoMPaSS-FLUX.1



【行业动态】 📰 Cherry Studio × 硅基流动:免费提供 Qwen38B,丰富多模型体验


免费提供Qwen38B接入,强化多平台、多模型支持。


面向跨行业场景的智能助手,提升生产力与个性化体验。



【效率工具】 ⚙️ 谷歌上线 Gemini API URL Context,可详解网页多模态内容


面向开发者的一键解析:可理解网页、PDF、图片等内容,处理上限约34MB。


无法越过付费墙,且不处理YouTube与Google Docs等专用源。


- 参考链接:https://towardsdatascience.com/googles-url-context-grounding-another-nail-in-rags-coffin/



【开源项目】 🧩 腾讯优图开源 Youtu‑Agent,自主智能体框架面向社区


面向构建、运行、评估自主智能体,支持数据分析、文件处理等任务。


模块化设计与对开源模型的友好支持,推动社区协作与创新。


- 项目链接:https://github.com/TencentCloudADP/Youtu-agent

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧