Aishaobing的个人播客 - 节目列表

【AI日报】EP.102 2月24 DeepSeek开源大模型加速器FlashMLA；海螺AI推I2V-01

1. **DeepSeek开源大模型加速器FlashMLA** - DeepSeek推出FlashMLA，专为英伟达Hopper架构GPU设计，优化变长序列场景下的推理性能。 - 采用BF16精度和页式键值缓存系统，处理速度达到3000GB/s，算力580TFLOPS。 - [详情链接](https://github.com/deepseek-ai/FlashMLA) 2. **海螺AI推出I2V-01-Director模型** - I2V-01-Director模型支持自然语言指令控制镜头运动，降低专业视频制作门槛。 - 该工具已整合至海螺AI的视频创作平台，用户可立即体验。 - [详情链接](https://hailuoai.video/create) 3. **谷歌AI视频生成模型Veo2使用成本曝光** - Veo2每秒费用为50美分，一分钟成本30美元，每小时高达1800美元。 - 相比漫威电影《复仇者联盟:终局之战》的每秒32,000美元制作成本，Veo2更具性价比。 4. **Grok3上线实时语音功能** - Grok APP新增实时语音模式，支持10种交互方式，提升用户体验。 - 新增Unhinged和Sexy模式，引发内容审核及未成年用户影响的讨论。 5. **百度APP全面焕新：上线AI入口** - 百度App全量上线AI入口，深度整合文心大模型与DeepSeek模型，提供AI搜索、信息提炼等功能。 - 首日使用量突破千万次，用户对新功能高度认可。 6. **腾讯混元视频模型（Hunyuan Video）测试招募中** - 混元视频模型参数量超过13B，具备强大的生成能力，现公开招募测试伙伴。 - [详情链接](https://docs.google.com/forms/d/e/1FAIpQLScZe9DflcpKf_JfcgGnAiXfyhEZAt2uP4mE0Rhs5l9R2m49oA/viewform) 7. **月之暗面联手UCLA推新模型Mixture-of-Expert** - Moonlight模型采用Muon优化器，显著提升大型语言模型的训练效率和稳定性。 - 在多个任务上优于传统的AdamW优化器，尤其在语言理解和代码生成方面表现优异。 - [详情链接](https://github.com/MoonshotAI/Moonlight?tab=readme-ov-file) 8. **1x发布家庭机器人NEO Gamma** - NEO Gamma家居机器人具备多项家务功能，如冲咖啡、洗衣和吸尘，并提供陪伴。 - 设计亲切温和，易于引发情感依赖，具备自然运动能力和语言交互功能。 - [详情链接](https://www.1x.tech/neo) 9. **小米将推出首款AI PC产品** - 小米即将推出的AI PC搭载99Wh超大电池，符合民航运输安全标准，提升移动办公续航能力。 - 深度整合AI技术，提供更智能的操作体验。 10. **阿里巴巴宣布创纪录投资** - 阿里巴巴未来三年将投入3800亿元人民币用于云和AI硬件基础设施建设。 - 加速行业智能化转型，提升中国在全球AI竞赛中的竞争力。 11. **Meta AI发布新型视频学习模型V-JEPA** - V-JEPA模型专注于无监督特征预测，直接从视频数据中学习，避免传统方法的限制。 - 在视频任务和低样本学习中表现出色，展示了高效的训练能力和强大的表示能力。 - [详情链接](https://ai.meta.com/research/publications/revisiting-feature-prediction-for-learning-visual-representations-from-video/) 12. **LiblibAI哩布哩布AI再获数亿元融资** - LiblibAI一年内完成四轮融资，创下国内AI应用赛道融资速度的新纪录。 - 公司致力于通过AI技术改变创作者的创作方式，建立完整的创作生态链。 - [详情链接](https://www.liblibai.com)

6分钟

【AI日报】EP.101 2月22 DeepSeek下周将开源五个项目；阿里通义万相将开源视频生成模型WanX 2.1

1. **DeepSeek开源预告：** DeepSeek宣布下周将陆续开源五个代码库，旨在推动AI行业发展，其在线服务模块已准备好投入生产环境。 2. **阿里通义万相WanX2.1：** 阿里巴巴即将开源视频生成模型WanX2.1，该模型支持中英文特效，用户可通过文本生成动态视频。 3. **ChatGPT用户激增：** ChatGPT周活跃用户突破4亿，较去年增长33%，付费企业用户数达200万。OpenAI预计2025年收入将达到110亿美元。 4. **Midjourney功能升级：** Midjourney网站新增多项组织功能，提升用户图像管理效率，优化了文件夹系统和图像操作流程。 5. **微软备战GPT-4.5 & GPT-5：** 微软为OpenAI即将推出的GPT-4.5和GPT-5模型积极准备服务器容量。GPT-4.5将在几周内发布，GPT-5计划在5月底推出。 6. **Clone公司首款类人机器人：** Clone Robotics推出全球首款类人机器人Protoclone，拥有肌肉和骨骼结构，运动表现极其人性化。详情链接：[https://www.clonerobotics.com/](https://www.clonerobotics.com/) 7. **腾讯元宝图像理解：** 腾讯元宝APP新增“看图说话”功能，通过“混元+DeepSeek”双模聚合技术，实现图像理解能力。 8. **小红书接入 Deepseek**：小红书推出AI 搜索产品“点点”内测深度思考功能。 9. **扣子Coze支持DeepSeek：** 扣子（Coze）平台独家支持DeepSeek Function Calling工具调用能力，用户可免费体验R1和V3模型。详情链接：[https://www.coze.cn/open/docs/guides/deepseek_reason](https://www.coze.cn/open/docs/guides/deepseek_reason) 10. **Figure新型智能模型：** Figure推出新型视觉-语言-行动模型Helix，让人形机器人接受语音命令做家务。详情链接：[https://www.figure.ai/news/helix](https://www.figure.ai/news/helix) 11. **阿里巴巴投资AI：** 阿里巴巴计划未来三年在云和AI基础设施投资超过去十年总和。 12. **DeepSeek App受欢迎：** DeepSeek App上线一个月下载量突破1亿，周活跃用户接近9700万。

【AI日报】EP.100 2月21 腾讯深度思考模型“混元T1”全面开放；字节跳动全新视频生成工具Phantom

1. **腾讯「混元 T1」模型全面开放**：深度思考模型面向所有用户，具备处理复杂任务的能力。可在腾讯元宝平台体验该模型及 DeepSeek-R1、混元 Turbo 等其他 AI 模型。 2. **xAI 免费开放 Grok3 模型**：号称“世界最聪明”，引入 DeepSearch 和 Think 新功能，增强信息综合和推理能力。将通过 API 提供标准版和推理版。 3. **AI 幻觉排行榜 Gemini2.0 Flash 领先**：Vectara 报告显示 Gemini2.0 系列幻觉率低，事实一致性高。相关链接：https://github.com/vectara/hallucination-leaderboard 4. **Opera 接入 DeepSeek R1 模型**：支持本地个性化部署，提升浏览器 AI 功能。可在 Web 浏览器中引入本地大语言模型，支持超过 50 种 LLM 访问。 5. **谷歌发布 PaliGemma2Mix**：全新视觉语言模型，集成图像描述、OCR、图像问答等功能，助力开发者。相关链接：https://arxiv.org/abs/2412.03555 6. **iPhone16e 发布，苹果智能将支持中文**：新机配备 8GB 内存，4 月初 Apple Intelligence 将增加中文支持。 7. **微软推多模态 AI 模型 Magma**：整合视觉、语言和动作决策技能，克服现有 AI 模型的局限性。相关链接：https://microsoft.github.io/Magma/ 8. **Xbox 推 AI 模型 Muse**：助力游戏开发者高效创建游戏元素，但引发关于创作自由的担忧。相关链接：https://news.xbox.com/en-us/2025/02/19/muse-ai-xbox-empowering-creators-and-players/ 9. **Grok3 模型曝严重安全漏洞**：易受攻击者操控，防御能力较弱，可能导致 AI 代理执行任务时产生安全隐患。 10. **Mistral 的 AI 助手 Le Chat 下载量破百万**：受法国总统支持，展示 AI 助手巨大市场潜力。 11. **字节跳动推“Phantom”**：全新视频生成工具，支持“参考主体生成”，实现主体复制粘贴和细节还原。 12. **HiveChat 提升团队协作**：支持 Claude、Deepseek 等多个 AI 模型，提供个性化聊天体验和云端数据存储。相关链接：https://github.com/HiveNexus/HiveChat

【AI日报】EP.99 2月20 DeepSeek推出NSA技术；小红书打击黑灰产用AIGC大模型矩阵养号

1. **月之暗面Kimi暂停大规模投流，战略重心转向底层模型** * 月之暗面(Moonshot AI)近期削减市场投放预算，暂停多个安卓渠道及第三方广告平台的投放。 * Kimi自然新增用户量显著上涨。 * 公司未来将专注于基础模型的重新训练和深度研究领域的智能体产品。 2. **小红书重点打击黑灰产团伙用AIGC大模型大规模矩阵养号行为** * 过去三个月，小红书处理超过320万个黑灰产账号。 * 治理工作聚焦于黑灰产养号和恶意营销，特别是利用AIGC大模型生成同质化内容的行为。 * 小红书将继续加强监管。 3. **DeepSeek 推出 NSA 技术：加速长上下文训练与推理** * DeepSeek团队发布NSA (Native Sparse Attention) 技术，提升长上下文训练和推理的速度，降低预训练成本。 * 采用分层稀疏策略优化注意力机制。 * 在多项基准测试中表现优异。 * 详情链接：[https://arxiv.org/pdf/2502.11089v1](https://arxiv.org/pdf/2502.11089v1) 4. **Magic1-For-1模型横空出世：一分钟视频“秒”速生成** * 英伟达发布Magic1-For-1视频生成模型，一分钟内可生成一段完整视频。 * 将文本到视频生成任务拆解为两个步骤，提高速度和质量。 * 详情链接：[https://magic-141.github.io/Magic-141/](https://magic-141.github.io/Magic-141/) 5. **马斯克新发布的Grok3智商堪忧，竟答错9.11和9.9哪个大** * Grok3被称为地球上最聪明的人工智能，计划应用于SpaceX火星任务。 * 测试中未能正确回答简单数学问题。 * Grok3使用了超过20万张H100芯片。 6. **百度文库AI功能月活用户达9400万，订阅收入同比增长21%** * 百度文库AI月活跃用户达9400万。 * 订阅收入同比增长21%。 * 百度文库推出100多个新功能。 7. **“ChatGPT之母”官宣创办新AI公司：思维机器实验室** * 前OpenAI首席技术官Mira Murati创办新AI初创公司“思维机器实验室”。 * 专注于开发与人类协作的AI产品。 * Murati正在组建顶尖团队。 8. **阿里巴巴大规模招聘人才，90%岗位与AI相关** * 阿里巴巴将进行大规模招聘，90%的岗位与人工智能相关，主要集中在AI To C业务。 * 招聘将吸引文本处理、多模态大模型及AI Agent等技术领域人才。 * 阿里旗下的AI应用“通义”整合到智能信息事业群。 9. **李彦宏回应开源文心4.5: DeepSeek让我们明白要开源** * 开源文心大模型4.5系列旨在提升用户体验，促进更广泛的应用。 * 李彦宏强调开源能激发用户好奇心。 * 百度的技术优势和持续研发投入使其在开源领域具备独特能力。 10. **罗福莉深夜回应：并非天才少女，只想安静做难而正确的事情** * 罗福莉首次回应外界“天才少女”标签，表示不希望被贴上这样的标签。 * 她认为过度的赞誉伴随着巨大的压力。 * 罗福莉呼吁自媒体停止对她及其家人的无差别打扰。 11. **OpenAI CEO在社交平台征询用户意见，或暗示重返开源之路** * Sam Altman在X平台上征询用户对未来开源项目的意见。 * 随着竞争对手的崛起，OpenAI 意识到完全封闭的开发策略已无法持续。

【AI日报】EP.98 2月19 马斯克发布王炸大模型Grok 3

【AI技术突破】 🤖 首个AI短剧视频生成模型SkyReels-V1开源 * 支持33种表情和400多种动作组合 * SkyReels-A1算法实现高保真微表情还原 * 推动AI短剧行业创新，降低制作成本详情链接: https://github.com/SkyworkAI/SkyReels-V1 【AI大模型】 🚀 xAI发布Grok 3，计算能力提升10倍 * 超越GPT-4o，支持图像分析与深度信息检索 * 新增DeepSearch功能，快速获取深度分析结果 * 未来将推出语音模式，提升用户体验【语音交互革新】 🎙️ 阶跃开源1300亿参数语音模型 * 支持多语言和方言识别，实现实时对话 * 具备语音克隆和情感控制功能，个性化交互体验详情链接: https://github.com/stepfun-ai/Step-Audio/tree/main 【视频生成新星】 🎥 阶跃星辰开源Step-Video-T2V * 300亿参数量，生成高质量视频 * 支持多种镜头运动，画面真实且符合物理规律详情链接: https://github.com/stepfun-ai/Step-Audio 【AI人才动态】 ✨ AI才女罗福莉开启新职业旅程 * 曾获雷军千万年薪邀请，推动AI模型创新【AI搜索功能】 🔍 秘塔AI推出“浅度研究”功能 * 小模型与大模型协同，快速完成数百网页分析 * 提升研究效率，未来将加入代码执行和数值分析【声音克隆工具】 🎤 Supertone Play上线，10秒完成声音克隆 * 支持英语、韩语和日语，未来扩展至中文和西班牙语 * 提供150种声音角色，适用于多种创作需求详情链接: https://play.supertone.ai/ 【智慧政务】 🏙️ 深圳福田、广州上线“AI公务员” * 基于DeepSeek大模型，覆盖240个业务场景 * 政务服务效率大幅提升，审核时间减少90% 【AI教育硬件】 📚 网易有道推出AI原生学习硬件SpaceOne * 集成DeepSeek-R1推理模型，覆盖10大学科 * 提供全题型深度讲解，提升学习效率【AI初创公司】 💰 OpenAI联合创始人SSI融资超10亿美元 * 专注于开发安全AI系统，估值超300亿美元【AI战略布局】 🛡️ OpenAI考虑特殊投票权抵御敌意收购 * 确保公司核心使命独立性，应对潜在收购威胁【AI技术更新】 🌙 月之暗面科技推出kimi-latest模型 * 支持128k上下文长度，图片理解与自动缓存 * 持续更新，确保用户体验最新AI技术

6分钟

【AI日报】EP.97 2月18 百度、微信接入DeepSeek；字节跳动AI编程工具Trae推出Windows版

1. **微信接入DeepSeek** 腾讯近日在微信搜索功能中灰度测试接入DeepSeek R1模型，旨在提升AI搜索体验。腾讯承诺不会使用用户个人信息，确保隐私安全。多个腾讯产品也在探索接入DeepSeek模型。 2. **百度全面接入DeepSeek及文心深度搜索** 百度搜索宣布全面接入DeepSeek和文心大模型的深度搜索功能，提供多模态输入输出能力。文心一言将于4月1日起全面免费开放，未来将推出新版本。 3. **字节跳动AI编程工具Trae推出Windows版** 字节跳动正式发布Trae的Win x64版本，支持Builder模式与AI对话，简化任务执行，提升开发效率。详情链接：https://www.trae.ai/ 4. **马斯克xAI将推出Grok 3** 马斯克宣布xAI将发布Grok 3，称其为“地球上最聪明的AI”，具备反思自身错误的能力，并超越现有市场竞争工具。 5. **Ready AI：输入提示词生成专业级网页** Ready AI允许用户通过文字指令在30秒内生成专业级网页，支持实时预览和版本对比，提升设计效率。详情链接：https://readdy.ai/home 6. **QQ浏览器接入DeepSeek-R1满血版** QQ浏览器正式接入DeepSeek-R1模型，支持实时联网搜索、多轮对话及历史记录回溯，提升搜索效率。 7. **Light-A-Video：无需训练实现视频重新打光** Light-A-Video通过一致光注意力模块和渐进光融合策略，解决视频重光照的时间一致性问题，提升视频质量。详情链接：https://bujiazi.github.io/light-a-video.github.io/ 8. **Meta推出Pippo模型：单张图片生成多视角视频** Meta推出的Pippo模型可从一张图片生成高分辨率多视角视频，开发者可自行训练模型并进行应用。详情链接：https://github.com/facebookresearch/pippo 9. **微软发布OmniParser V2.0：截图转化为结构化格式** 微软OmniParser V2.0将UI截图转化为结构化数据，提升基于大型语言模型的操作体验，准确率显著提高。详情链接：https://huggingface.co/microsoft/OmniParser-v2.0 10. **月之暗面解密o1：Long-CoT是关键** 月之暗面研究员Flood Sung探讨Long-CoT的重要性，强调其在小型模型训练中的应用效果，推动更接近人类思考能力的研究。详情链接：https://mp.weixin.qq.com/s/sJmT-tM3A-mglZ1d4OI80A 11. **Meta研发无创脑机接口：思维打字达到80%准确率** Meta开发的无创脑机接口通过读取脑信号实现文字输入，当前准确率达80%，但仍需改进以投入实际应用。

【AI日报】EP.96 2月15 百度文心大模型4.5系列将开源；昆仑万维发布世界模型Matrix-Zero

1. **【百度大模型】** * 百度文心大模型4.5系列即将开源（6月30日） * 文心一言4月1日起免费开放，新增深度搜索功能 2. **【3D世界模型】** * 昆仑万维发布Matrix-Zero世界模型 * 支持3D场景生成和可交互视频生成 3. **【GIF制作神器】** * Pika Labs推出Pikamemes应用 * 自拍照秒变个性化GIF，心情随意切换 * 应用商店链接: [https://apps.apple.com/us/app/pika-ai-video/id6680155400](https://apps.apple.com/us/app/pika-ai-video/id6680155400) 4. **【谷歌AI助手】** * 谷歌Gemini推出“全局记忆”功能 * 记住用户所有对话，交流更自然 5. **【AI代码编辑器】** * Windsurf Wave3更新发布 * 增强AI编辑体验，Tab键跳转，Turbo模式 * 详情链接: [https://codeium.com/blog/windsurf-wave-3](https://codeium.com/blog/windsurf-wave-3) 6. **【ChatGPT更新】** * ChatGPT上线个性化用户自定义指令功能 * 可设置GPT性格，增强互动体验 7. **【Anthropic新模型】** * Anthropic即将发布混合AI模型 * 兼顾速度与深度推理，成本可控 8. **【苹果AI合作】** * 苹果仍与百度合作为国行iPhone开发AI功能 * 新AI搜索和Siri升级将整合进“Apple Intelligence” 9. **【YouTube视频模型】** * 最强视频模型Veo2可在YouTube上玩了 * 支持4K,文本生成,增强视频创作. * 详情链接:[https://blog.youtube/news-and-events/veo-2-shorts/](https://blog.youtube/news-and-events/veo-2-shorts/) 10. **【苹果AI计划】** * 苹果计划在2025年中之前将AI功能引入中国iPhone * 苹果将与阿里巴巴合作开发本地化的AI功能。 11. **【AI 技能】** * 2025年十大AI 技能,可以让你薪资增长高达47% 12. **【OpenAI 政策更新】** * OpenAI 删除部分 ChatGPT 内容警告政策以提升用户体验.

【AI日报】EP.95 2月14 王炸！OpenAI将上线GPT-5免费无限使用；百度文心一言于4月起全面免费

1. **百度文心一言全面免费并上线深度搜索功能** - **主要内容**：自4月1日起，文心一言将全面免费，用户在PC和APP端均可无门槛使用最新模型。此外，深度搜索功能也将免费开放，具备多模态输入输出，能够提供专家级内容回复，处理多场景任务。 - **相关链接**：无 2. **OpenAI将上线GPT-5免费无限使用** - **主要内容**：OpenAI首席执行官萨姆·奥尔特曼透露，GPT-5预计将在几个月内推出，免费版用户将享受无限制对话，而Plus和Pro用户将获得更智能的功能，包括语音、画布和深度研究等。GPT-4.5被称为Orion模型，预示着OpenAI未来的发展方向。 - **相关链接**：无 3. **快手发布CineMaster视频生成框架** - **主要内容**：快手推出了CineMaster，一个创新的文本到视频生成框架，具备3D感知能力。用户可以通过多种控制信号精确控制视频中物体的位置和相机运动，极大提升了创作自由度。 - **相关链接**：无 4. **腾讯元宝支持DeepSeek R1可联网搜索公众号内容** - **主要内容**：腾讯元宝最近进行了重要升级，正式支持DeepSeek R1模型，并引入了联网搜索公众号内容的功能。这一更新显著提升了用户的信息获取效率，结合语音和文字输入，元宝能够提供最新、最权威的信息。 - **相关链接**：无 5. **Adobe Firefly AI视频生成工具公测** - **主要内容**：Adobe最近推出了Firefly Video的公开测试版本，允许用户将文本和图像转化为最长5秒的1080p短视频。该工具的用户界面友好，支持多种自定义设置，并具备AI翻译功能，支持超过20种语言。 - **相关链接**：[详情链接](https://www.adobe.com/de/products/firefly.html) 6. **阿里发布Animate Anyone2技术** - **主要内容**：阿里巴巴最近推出的Animate Anyone2技术能够实现视频中人物的精准替换和动作的无缝迁移。用户只需提供原始视频和目标角色图像，系统便可在保留动作轨迹的同时，实时替换人物形象。 - **相关链接**：[详情链接](https://humanaigc.github.io/animate-anyone-2/) 7. **全新视频生成模型Magic1-For-1** - **主要内容**：DA-Group-PKU团队推出的Magic1-For-1模型能够在短短一分钟内生成一段一分钟长的视频剪辑。这一技术通过优化内存使用和减少推理延迟，显著提升了视频生成的效率。 - **相关链接**：[详情链接](https://github.com/DA-Group-PKU/Magic-1-For-1) 8. **雷军谈DeepSeek：要学会用AI提高工作效率** - **主要内容**：小米CEO雷军在直播中分享了他对AI技术的看法，强调AI在日常生活中的重要性，并鼓励大家学习使用AI工具来提高工作效率。他提到AI的广泛应用将为个人带来竞争优势。 - **相关链接**：无 9. **Meta寻求收购AI芯片公司FuriosaAI** - **主要内容**：Meta正在洽谈收购韩国芯片初创公司FuriosaAI，以增强其人工智能硬件基础设施。此举旨在应对日益增长的AI需求，FuriosaAI专注于开发加速AI模型运行的芯片。 - **相关链接**：无 10. **Anthropic预计2027年收入将达345亿美元** - **主要内容**：Anthropic公司在最新财务预测中展现出强劲的增长潜力，预计到2025年收入将达到37亿美元，现金流出将减少近一半。管理层对未来发展持乐观态度，预计到2027年年收入将飙升至345亿美元。 - **相关链接**：无

【AI日报】EP.94 2 月 13 苹果和阿里将为中国iPhone开发AI功能；百度今年或将发布Ernie 5.0

【科技合作】📱 苹果与阿里联手开发中国版iPhone AI功能 * 阿里巴巴凭借AI技术优势获选合作方 * 评估发现Deepseek等团队大客户支持能力不足 * 合作凸显苹果对中国市场战略布局【AI模型】🤖 百度Ernie 5.0计划年内发布 * 多模态能力将大幅增强，应用场景扩展 * 应对苹果合作阿里带来的市场竞争压力 * 具体功能细节尚未公开【政策支持】🔗 国家超算平台开放DeepSeek免费API * 提供3个月免费API使用权及千万卡时算力 * 已连接14省超算中心，整合6500款算力资源 * 支持DeepSeek-R1私有化部署【技术创新】⚡ 字节跳动UltraMem架构降本83% * 推理速度提升2-6倍，访存成本接近Dense模型 * 突破MoE模型效率瓶颈 * 为十亿级大模型应用铺路【开源项目】🎤 小红书FireRedASR语音识别模型开源 * 中文识别错误率仅3.05%，刷新行业纪录 * 提供高精度版(LLM)和高效版(AED)双架构 * 支持方言及多语言场景项目链接：https://huggingface.co/FireRedTeam 【行业研究】🔋 ChatGPT单次响应能耗仅0.3瓦 * 实际能耗为早期预估值的1/10 * OpenAI计划扩建数据中心应对未来需求 * 复杂任务或推高AI整体能耗【智能硬件】🚗 东风日产N7首搭DeepSeek大模型 * 配备高通8295P芯片，支持全场景泊车 * 无边框车门+自定义灯光系统 * 人机交互流畅度达新高度【法律动态】⚖️ 汤森路透胜诉AI版权案 * 法院裁定其数据受版权保护 * 生成式AI公司需规范数据使用 * 为内容创作者权益确立判例【产品更新】🎥 YouTube推AI自动配音工具 * CEO称AI为2025核心战略 * 支持视频多语言翻译，本月全面上线 * 机器学习算法实现用户年龄识别【智能家居】📺 海信电视升级DeepSeek语音交互 * 语音/遥控器双通道启动AI对话 * 星海大模型提升需求理解精准度 * 同步完善智慧城市交通知识库

8分钟

【AI日报】EP.94 2 月 12 日DeepSeek梁文峰或成亚洲顶级科技富豪；字节发布新视频模型Goku

【AI热点】 1. **DeepSeek估值暴涨，创始人或成亚洲新贵** * DeepSeek估值预计10亿到1500亿美元。 * 创始人梁文峰可能拥有1260亿美元资产。 * 尚未接受外部融资，依靠量化对冲基金盈利。 2. **字节联合港大发布Goku视频模型** * 可根据文本提示生成高质量视频。 * 模型展示了多种场景。 * 详情链接:https://saiyan-world.github.io/goku/ 3. **马斯克欲巨资收购OpenAI遭拒** * 马斯克提出以974亿美元收购。 * OpenAI CEO 奥特曼拒绝。 * OpenAI 转型为营利性公司。 4. **OpenAI自研芯片，台积电代工** * 目标减少对英伟达的依赖。 * 预计2026年大规模生产。 5. **ZyphraAI开源Zonos-TTS** * 支持实时语音克隆和多语言情感控制。 * 模型开源且可商用。 * 每月可免费生成100分钟音频 * 详情链接:https://huggingface.co/Zyphra/Zonos-v0.1-hybrid 6. **阿里通义实验室开源音乐生成技术InspireMusic** * 一个开源的音乐生成工具包. * 支持多种曲风和情感表达 * 详情链接:https://github.com/FunAudioLLM/InspireMusic 7. **知乎AI搜索产品知乎直答接入“满血版”DeepSeek-R1** * 提升知乎直答的推理能力和搜索体验。 * 结合社区优质语料 * 新增知识库功能 8. **百度文小言App更新:引入DeepSeek-R1模型,拍照解题能力大幅提升** * 拍照解题功能得到了显著提升 * 新增伴学模式 * 手抄报和作文功能的加入 9. **OPPO AI接入DeepSeek-R1旗下Find N5将于2月20发布** * Find N5是全球最薄的折叠屏手机 * 搭载高通骁龙8 * 接入DeepSeek-R1大模型

8分钟

【AI日报】EP.93 百度风投回应错过投资DeepSeek；Cursor荣获Product Hunt年度最佳产品

AI 开年七天乐活动微信二维码【AI投资】百度风投回应错过投资DeepSeek * 与DeepSeek同处一栋大楼但未达成合作 * 因DeepSeek未拆分独立融资计划导致投资未果 * 百度风投持续关注人工智能初创企业【产品荣誉】 Cursor荣获Product Hunt年度最佳产品 * AI编程工具Cursor提升开发者效率 * Notion Sites获无代码奖，简化网站建设流程 * Supabase AI Assistant获数据安全奖详情链接:https://www.producthunt.com/golden-kitty-awards/hall-of-fame 【模型开源】豆包开源视频生成模型“VideoWorld” * 仅凭视觉信息实现知识学习，无需语言模型 * 在围棋和机器人任务中展现推理与规划能力 * 代码与模型已开源详情链接:https://arxiv.org/abs/2501.09781 【用户增长】 ChatGPT访问量跃居全球第六 * 流量占比达2.33%，超越Netflix与Reddit * OpenAI开放搜索功能吸引更多用户 * Google仍占据访问量首位【域名动态】顶级域名ai.com重定向至DeepSeek官网 * 首次指向中国AI企业DeepSeek * 域名曾多次跳转，OpenAI曾传言欲收购 * 体现中国AI企业全球影响力【脑机接口】 Meta发布脑机接口模型Brain2Qwerty * 可通过脑电波解码打字内容 * MEG解码字符错误率更低 * 为BCI技术带来新方向详情链接:https://ai.meta.com/research/publications/brain-to-text-decoding-a-non-invasive-approach-via-typing/ 【新品内测】 OpenAI内测Sora图像生成器 * 或将推出DALL-E4 * 用户可在视频和图像生成间快速切换 * 新增“Best”和“Top”视频分类【营销事件】 OpenAI一掷千金投放超级碗广告 * 耗资1400万美元展示AI创新 * 旨在让大众理解AI应用 * 广告由Sora等AI工具辅助制作【多模态学习】 Meta AI推出MILS系统 * LLMs无需专门训练即可处理多媒体数据 * 视频内容描述优于现有模型 * 推动多模态AI更智能发展【安全漏洞】 HuggingFace平台现恶意AI模型 * 利用“损坏”pickle文件绕过安全扫描 * 模型含反向shell可远程控制 * 平台已更新安全工具【行业观点】奥特曼称GPT-4.5编程能力将超人类 * GPT-4.5编程能力已达全球Top50程序员水平 * AI将改变教育和职业技能需求 * OpenAI计划走向开源【艺术前沿】佳士得将举办人工智能艺术拍卖会 * 首场专注AI艺术品拍卖 * 展出机器人绘画等作品 * 艺术界反响不一

8分钟

99