Album
时长:
6分钟
播放:
107
发布:
6个月前
主播...
简介...
https://xiaoyuzhoufm.com

【AI日报】腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级



1. **腾讯宣布混元3D 2.1大模型对外开源**


   - 首个全链路开源工业级3D生成大模型,几何生成与PBR材质生成效果显著提升。


   - 支持游戏、电影、电商等领域生成高质量3D角色、道具与产品模型,告别传统‘塑料感’。


   - 全链路开源且部署友好,适配消费级显卡,适合个人与团队快速上手开发。


   - 详情链接: https://3d-models.hunyuan.tencent.com/



2. **OpenAI Codex 全新升级: 让程序员轻松获取理想代码**


   - 新增生成多种代码版本功能,满足不同需求,提升开发效率。


   - 优化细节包括加载进度查看、取消操作及安装问题修复,操作更灵活。


   - 基于codex-1模型优化,提高代码生成准确性,支持GitHub代码库提取。



3. **字节跳动AI Lab负责人李航卸任,Seed团队步入调整期**


   - 李航卸任AI Lab负责人,转为劳务/顾问身份,标志着字节跳动AI Lab的重大人事调整。


   - 自2020年起,AI Lab逐步转型为技术中台,并在2023-2024年将部分大模型团队并入Seed团队。


   - 字节跳动AI Lab自2016年成立以来,历经多位负责人领导,逐步成为支撑字节跳动多项业务的技术核心。



4. **微软发布700个真实AI案例,探索智能化工作新模式**


   - 微软展示了700个AI应用案例,涵盖金融、医疗、教育等多个行业。


   - AI智能体通过自动化任务,显著减少工作时间,提升企业效率。


   - 众多企业借助AI提升客户体验,推动业务增长与运营优化。



5. **微软AI重磅发布Code Researcher: 58%崩溃解决率震撼业界!**


   - Code Researcher基于大型语言模型(LLM),能深度分析代码库和提交历史,追踪崩溃根本原因并生成修复补丁。


   - 在Linux内核崩溃修复测试中,Code Researcher的崩溃解决率高达58%,远超SWE-agent的37.5%。


   - 适用于多种大型代码库,为企业级软件维护提供高效解决方案,推动系统级软件开发自动化进程。


   - 详情链接: https://www.microsoft.com/en-us/research/publication/code-researcher-deep-research-agent-for-large-systems-code-and-commit-history/



6. **AI监工上线! Observer AI让屏幕自动化更高效,解放你的双手**


   - Observer AI通过高精度捕捉技术完整记录界面变化,确保数据无遗漏。


   - 内置先进算法快速解析屏幕内容,识别任务完成情况或潜在问题。


   - 支持调用MCP或自定义方案,自动执行下一步操作,实现闭环自动化。


   - 详情链接: https://github.com/Roy3838/Observer



7. **Genspark AI 发布革新性AI Browser,开启智能网络浏览新时代**


   - Genspark AI Browser内置AI代理,提供智能导航与内容分析,例如自动搜索全网最低价。


   - 支持MCP Store模块化扩展,用户可通过定制化AI工具满足多样化需求。


   - 适用于多种场景,包括学术研究、商业决策及内容创作,提升信息处理与任务自动化效率。



8. **麻省理工利用AI技术迅速修复15世纪名画,仅需三个半小时**


   - 麻省理工开发新技术,通过AI修复名画,仅需三个半小时。


   - 该技术将修复时间从数月缩短到几个小时,大幅提高效率。


   - 采用可拆卸掩膜和数字地图,修复过程安全可逆,保护原画。



9. **蚂蚁集团和Inclusion AI联合推出Ming-Omni: 首个开源版多模态GPT-4o**


   - 支持多模态输入融合处理,无需额外模型或特定任务微调,高效完成多样化任务。


   - 提供语音与图像生成功能,支持方言理解、语音克隆及上下文感知对话,提升人机交互体验。


   - 首个开源多模态模型,与GPT-4o匹敌,激励社区研究与开发,推动技术进步。


   - 详情链接: https://lucaria-academy.github.io/Ming-Omni/



10. **视频版AI换衣框架MagicTryOn,基于Wan2.1视频模型**


    - MagicTryOn采用扩散变换器,显著提升视频虚拟试穿的时空一致性。


    - 引入粗到细的服装保留策略,增强服装细节表现力。


    - 在大幅度运动场景下表现优异,展现服装与人体动作的自然互动。


    - 详情链接: https://vivocameraresearch.github.io/magictryon/



11. **字节跳动Seaweed APT2震撼发布! 实时互动AI视频生成,解锁3D虚拟世界新纪元**


    - Seaweed APT2采用自回归对抗后训练技术,大幅降低计算复杂性,实现高效实时视频生成。


    - 支持实时3D世界探索和互动虚拟人类生成,适用于虚拟主播、游戏角色等多种场景。


    - 相比传统模型,Seaweed APT2在动作连贯性和场景多样性方面有显著提升,开启AI视频生成新篇章。



12. **OpenAI升级ChatGPT Search功能,提供更精准、更智能的响应**


    - 新增图片搜索功能,支持多样化交互方式。


    - Projects功能升级,助力高效管理对话和文件。


    - 挑战谷歌霸主地位,提供更高效、人性化搜索体验。



13. **字节火山引擎澄清与老凤祥AI智能眼镜合作传闻**


    - 火山引擎否认与老凤祥合作开发AI智能眼镜,但老凤祥展示的眼镜确实使用了豆包大模型。


    - 老凤祥AI眼镜专为老年用户设计,具备多种实用功能如语音导航、实时翻译等。


    - 豆包大模型作为公开产品,任何合规客户均可购买并应用到自己的设备中。

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧