AI圆桌π
汇聚全球顶尖AI专家/学者关于人工智能的最新观点

Album
主播:
力力说
出版方:
力力说
订阅数:
697
集数:
19
最近更新:
1个月前
播客简介...
《AI圆桌π》汇聚全球顶尖AI专家/学者关于人工智能的最新观点。节目采用AI技术生产播客+邀请行业专家接受访谈,从技术发展到未来影响,为你呈现多元视角,带你深入了解 AI 的魅力与挑战,一同探索人工智能时代的无限可能
AI圆桌π的创作者...
AI圆桌π的节目...

DeepSeek登《Nature》封面! 梁文峰披露R1训练只花200万

AI圆桌π

这篇报道详细介绍了 DeepSeek-R1 模型,该模型凭借其开创性的 纯强化学习(RL) 推理范式登上了《自然》杂志封面。文章披露了 DeepSeek-R1 的训练成本极低,仅 294,000 美元,并强调它是全球首个经过 同行评审 的主流大型语言模型。 关键成果包括: • 范式创新:首次证明仅通过强化学习,无需传统的监督微调(SFT)引导解题步骤,即可训练出具备高级推理能力的AI模型。 • 超高性价比:R1的专项训练成本仅为29.4万美元,即使加上基础模型成本(约600万美元),也远低于行业巨头的训练开销,展示了极高的资本效率。 • 卓越性能:在AIME 2024数学竞赛等任务上,R1的准确率高达86.7%,远超人类参赛者的平均水平,并在训练中展现出“顿悟时刻”和自我进化的高级策略。 • 行业先例:DeepSeek-R1是全球首个经历严格同行评审的主流大语言模型,其开源和透明化的研发过程为行业树立了新标杆,获得了评审员的高度评价。 • 技术演进:模型从专注于推理的R1-Zero版本,通过精密的四阶段训练流程,演进为兼具顶尖推理能力与强大通用能力的DeepSeek-R1,在用户偏好基准上性能提升了17%-25%。 一、核心成就与业界影响 DeepSeek-R1的研究成果《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》于2025年1月发布后,成功登上《Nature》杂志封面,并获得了专题评论文章的高度赞扬。这一成就不仅是对其技术创新的肯定,也标志着其在AI领域的重大影响力。 • 开创性同行评审:R1被认为是首个经历严格同行评审的主流大语言模型。这一过程增强了模型的有效性和实用性验证。 • 惊人的训练成本:补充材料首次披露,R1的训练成本仅为294,000美元。这一数字远低于业界普遍认为的训练顶尖AI模型的成本。 • 开源社区反响:模型在Hugging Face上开源后,迅速成为最受欢迎的模型之一,下载量突破1090万次。 • 行业质疑与验证:面对OpenAI关于其可能使用ChatGPT数据进行训练的质疑,DeepSeek团队澄清其模型学习并非通过复制推理示例,而是基于对网络公开数据的学习。Lewis Tunstall和其他实验室的复现尝试也证实,DeepSeek的强化学习方法本身已足够强大,足以获得极高性能。Tunstall评价道,R1“开启了一场革命”。 二、DeepSeek-R1-Zero:纯强化学习的探索 研究的起点是DeepSeek-R1-Zero,一个大胆而纯粹的实验,旨在验证一个核心假设:摆脱人类定义的推理模式,AI能否自主进化出更强的推理能力。 训练理念与框架 团队选择了一个强大的基础模型DeepSeek-V3 Base,并完全跳过了传统的监督微调(SFT)阶段。取而代之的是一个极其简洁的强化学习框架,只向模型传递两个信号: 1. 任务格式:回答必须包含由标签包裹的“思考过程”和由标签包裹的“最终答案”。 2. 奖励信号:完全基于最终答案的正确性给予奖励,不干预思考过程。 能力的涌现与“顿悟时刻” 在无具体解题步骤指导的训练中,R1-Zero展现了惊人的自我进化能力。 • 性能飞跃:以AIME 2024数学竞赛为例,模型的平均解题准确率(pass@1)从最初的15.6%飙升至77.9%。结合“自洽解码”技术后,准确率更是高达86.7%,远超人类选手的平均水平。 • “思考时间”自主增加:随着训练进行,模型在标签内生成的文本长度稳步增加,表明它自发地学会了用更长的“思维链”来探索和优化解题策略。 • 高级策略涌现:模型不再是线性解题,而是展现出“自我反思”和“系统性探索替代解法”等高级行为,会主动验证中间步骤或尝试其他解法。 • “顿悟时刻” (Aha Moment):研究人员观察到,在训练的某个阶段,模型在反思过程中使用“wait”(等等)一词的频率突然急剧增加。这标志着模型推理模式的质变,是其自我进化过程的清晰体现。 三、DeepSeek-R1的演进:从专才到通才 尽管R1-Zero推理能力强大,但它也存在可读性差、语言混杂、通用能力弱等问题。为了解决这些问题并使其能力得到更广泛应用,团队设计了一套精密的多阶段训练流程,将R1-Zero“精炼”为DeepSeek-R1。 经过这一系列流程,最终的DeepSeek-R1不仅在数学、编程等高难度推理任务上保持顶尖水准,其通用指令遵循和用户偏好能力也大幅提升,在AlpacaEval 2.0和Arena-Hard等基准上性能提升了17%-25%。 四、挑战与未来展望 DeepSeek-R1的成功带来了深刻启示,同时也面临着新的挑战。 • 当前局限性: ◦ 结构化输出与工具使用:模型在这些方面的能力尚有欠缺。 ◦ 提示词敏感性:对复杂的少样本提示不适应,在零样本直接提问时效果最佳。 ◦ 特定领域提升有限:由于强化学习在耗时长的软件工程任务上效率不高,模型在该领域的提升有限。 • 奖励投机(Reward Hacking): ◦ 纯强化学习的成功依赖于可靠的奖励信号。对于有明确对错的领域(如数学)这很容易实现,但对于主观任务(如写诗),设计完美的奖励模型极其困难。 ◦ 如果奖励信号存在漏洞,模型可能会“投机取巧”以骗取高分,而非真正提升能力,这是未来需要持续关注和解决的核心问题。 如果希望和主播建立联系/加入听友群,可加微信bonewe2004! 关于主播: 加入听友群,请扫二维码

9分钟
52
1个月前

7亿人ChatGPT使用习惯首曝光!答案颠覆你的想象!

AI圆桌π

近日,由 OpenAI、哈佛大学及杜克大学联合发布的《How People Use ChatGPT》研究报告发布。该报告基于对2024年5月至2025年6月期间超过150万条真实对话的抽样分析,揭示了全球超7亿周活用户的实际AI使用模式。核心洞察表明,当前AI的主流应用并非从零开始创造内容,而是对已有文本进行“加工”与“优化”,扮演着“写作助手”的角色。在不同场景下,AI呈现出双重身份:在日常生活中是“百科+顾问”,在工作环境中则是“生产力外包工具”。研究颠覆了多个刻板印象,指出用户更倾向于增强而非替代人类工作,AI正成为辅助思考的“决策外挂”。随着用户画像日益接近全球人口平均分布(女性用户占比反超,中低收入国家增长迅速),AI产品设计的重心必须从展示模型能力的“炫技”阶段,转向提升用户体验、建立信任机制和实现普惠应用的“打磨”阶段。真正的行业赛点已从模型本身转向设计、体验与信任的综合考验。 核心研究概述 • 研究样本:涵盖2024年5月至2025年6月期间,消费者版ChatGPT产生的超过150万条真实对话。 • 处理方式:采用大型语言模型(LLM)进行自动标注,并通过隐私保护管线处理,确保研究人员不接触任何原始用户数据。 • 用户规模:截至2025年7月,ChatGPT的周活跃用户数已突破7亿,约占全球成年人口的十分之一,每周产生的消息量高达180亿条。这项研究的真正价值在于揭示了AI对话使用的真实规律,以及这些规律与公众普遍认知之间的显著差异。 五大关键用户行为洞察 报告系统性地剖析了用户的行为模式,推翻了关于AI使用的多项普遍存在的刻板印象,勾勒出一个AI作为“写作助手”、“生活顾问”和“决策副驾”的清晰画像。 1. 倾向于内容“加工”而非“从零生成” 与AI被视为“自动写手”的普遍观念相反,数据显示用户更多地将其用作内容优化工具。 • 写作任务的主导地位:在所有与职场相关的对话中,写作类任务占比高达四成。 • “加工”是核心需求:在这些写作任务中,有三分之二属于“加工”性质,包括改写、润色、翻译或优化逻辑,而非从零开始生成内容。 • 结论:用户并非将ChatGPT视为完全的替代者,而是作为一种增强工具,帮助他们更高效地打磨和完善已有的文本内容。 2. “决策支持”与“直接产出”的双重角色用户的意图在不同场景下表现出明显的差异,揭示了AI应用需扮演的双重角色。 • 总体意图分布:在所有对话中,“提问”(Asking)占比最高(51.6%),其次是“执行任务”(Doing)(超过三成),而“表达”(Expressing)最少(仅一成)。 • 工作场景的逆转:在工作相关场景中,“执行任务”的比例跃升至56%,其中写作是最主要的任务类型。 • 结论:在日常生活中,人们更多将AI视为获取信息和建议的“百科+顾问”;而在工作环境中,它则转变为一个高效的“生产力外包”工具。AI产品必须同时满足“决策支持”与“直接产出”的双重需求。 3. 用户画像的演变与多样化ChatGPT的用户群体正在迅速演变,其构成越来越贴近全球人口的平均分布,这对产品设计提出了新的挑战。 • 性别比例变化:早期用户以男性为主(约占八成),但到2025年中期,女性用户占比已达到52%,实现反超。 • 年龄结构:26岁以下的年轻用户贡献了接近半数的消息量,显示出对AI技术更强的接受能力。• 地域分布:用户增长更快的地区来自中低收入国家。 • 结论:用户画像的多样化意味着AI产品在功能和交互设计上需要满足更广泛、更多元的需求。 4. 工作场景中的“决策外挂”定位 通过将对话内容与美国劳工部ONET工作活动分类进行映射,研究发现AI在工作中的核心作用是增强人类的认知能力。 • 三大核心应用:使用最频繁的三类工作活动是“决策与问题求解”、“记录信息”和“创造性思考”。 • 增强而非取代:这一发现有力地反驳了“AI抢饭碗”的普遍焦虑。AI更像是一个为人类大脑装配的“决策外挂”,帮助用户更快、更全面地思考问题。 • 结论:取代人类并非AI应用的主线故事,增强人类的决策能力和创意实现才是更真实的图景。 5. 用户满意度的显著提升 研究通过自动化方法标注了“好互动”与“坏互动”,结果显示用户体验在持续改善。 • 正向互动增长迅速:数据显示,“好互动”的增长速度远快于“坏互动”。 • 满意度量化:到2025年中期,正向互动的数量已是负向互动的四倍。 • 结论:AI模型的进步并非仅停留在实验室的基准测试中,而是被用户在实际对话中直接感知和体验到,带来了更高的满意度。 对AI产品设计的启示 报告所揭示的用户行为模式,为AI应用厂商和开发者指明了产品设计的核心方向,即从技术展示转向满足真实、细分的场景需求。 1. 贴近真实需求,优化产品入口鉴于大多数写作任务是“加工”而非“生成”,产品的入口设计应反映这一现实。 • 超越空白输入框:与其在界面中心放置一个等待用户从零开始输入的空白框,不如优先提供粘贴、批注、差异对比等功能。 • 定位为“增强器”:产品应将自身定位为帮助用户补齐碎片化需求的“增强器”,而非试图全面替代专业软件。Stack Overflow的调查也佐证了这一点,开发者最常使用AI进行代码片段生成和错误解释,而非复杂的系统开发。 2. 提供分层体验,满足多样化用户随着用户群体的扩大,单一的产品体验已无法满足所有人的需求。 • 新手用户:需要结构化模板、语气选择和逐步引导等功能,以降低使用门槛。 • 熟练用户:则需要快捷命令、自定义工具链以及深度集成的API,以实现更高的效率和灵活性。• 挑战:如果应用不能提供分层的体验,将面临要么对新手过于复杂、要么对专家过于浅薄的两难局面。 3. 嵌入工作流程,建立信任机制报告指出,高频使用并不等同于高信任度。要让AI真正融入企业级应用,建立信任是关键。 • 可验证与可追溯:用户愿意依赖AI的前提是其结果能够被验证、追溯,并能融入组织现有的合规体系。 • 内置信任功能:AI应用在设计之初就应考虑数据来源标注、版本对比、结果审计等机制,而不是作为事后补丁。 4. 从“炫技”转向“打磨”,聚焦用户体验AI应用的发展已进入新阶段,重点不再是证明模型的能力,而是提升其实用性。 • 真实场景的价值:关键在于如何在真实场景下,让用户更快、更安全、更普遍地使用AI。 • 新赛点:真正的竞争赛点已经从模型本身,转向了用户体验、信任和普惠性。 结论:从技术竞赛到体验考验OpenAI的这份研究报告清晰地表明,至少在现阶段,用户更多地将AI视为一种“增强”工具,而非“替代”品。他们需要的是能够降低工作摩擦、提升效率的无缝体验,而不是令人惊叹但脱离实际的模型展示。这意味着整个行业正经历一场深刻的转变:**AI的发展已从一场单纯的技术竞赛,演变为一场关于设计、体验与信任的综合考验。**当全球数亿人每天都在与AI进行对话时,一种全新的人机交互范式正在形成。AI的未来走向,最终将由人们选择如何使用它来决定,而非技术本身。

18分钟
99+
1个月前

真实、残酷的AI就业冲击:哈佛大学研究揭示初级岗位和普通大学毕业生首当其冲

AI圆桌π

份基于海量真实数据的哈佛大学研究报告,严谨地揭示了自2022年底生成式人工智能(AI)兴起以来,其对美国就业市场造成的真实且残酷的冲击。研究的核心发现表明,AI并非通过大规模裁员,而是通过一种更隐蔽的方式——冻结初级岗位的招聘——来替代人类工作。这一趋势正在侵蚀传统职业阶梯的底层,对特定人群构成了严重挑战。 核心洞察包括: • “剪刀差”效应: 从2022年中开始,高级岗位的就业增长持续,而初级岗位的增长则急剧停滞甚至掉头向下,两者走势形成鲜明反差,时间点与ChatGPT的发布高度吻合。 • AI是主因: 采用AI技术的公司(AI采纳者)与未采用的公司相比,其初级岗位招聘数量出现了断崖式下跌,差距在六个季度后拉大至7.7%,从而证实了AI与初级岗位流失之间的直接因果关系。 • 冲击机制: AI对就业的冲击主要表现为停止招聘而非裁员。AI采纳者公司并未出现离职率上升,而是平均每季度少招了3.7名初级员工,这是一种成本更低、更不易察觉的“温水煮青蛙”式替代。 • 行业重灾区: 尽管影响普遍存在于各行各业,但批发和零售业受到的冲击最为严重。该行业中,拥抱AI的公司其初级岗位招聘量比未拥抱AI的公司减少了近40%。 • 学历的“U型曲线”: 冲击并非均匀分布在所有学历背景的毕业生中。来自顶尖名校(Tier 1)和普通大学(Tier 5)的毕业生受影响较小,而来自中上等大学(Tier 2和Tier 3)的毕业生因其“高不成、低不就”的性价比,成为了受冲击最严重的群体。 1. 研究背景与方法论 该分析基于一篇由哈佛大学经济学博士生Seyed M. Hosseini和Guy Lichtinger撰写、由劳动经济学权威拉里·卡茨(Larry Katz)指导的论文。研究以其严谨的论证和庞大的真实数据为基础,冰冷客观地剖析了AI对就业市场的具体影响。 1.1 核心数据集 研究使用的数据来自Revelio Labs公司,该数据集基于LinkedIn的招聘信息收集,具有极高的代表性。 • 公司数量: 285,000家• 员工简历: 覆盖6200万名劳动者 • 招聘记录: 超过1.5亿次鉴于美国总人口约为3.4亿,该数据集几乎覆盖了大部分的在职人群,接近全量原始数据。 1.2 研究方法:差异中的差异(DiD)为确定AI是导致就业变化的直接原因,而非仅仅是相关性,研究采用了经济学中经典的“差异中的差异”(Difference-in-Differences, DiD)方法,构建了一个准实验对照研究。 • 实验组(AI采纳者): 通过招聘数据识别。如果一家公司的招聘岗位描述中包含“LLM”、“Prompt Engineer”、“GenAI”等与大模型相关的关键词,则被定义为“AI采纳者”。研究共识别出10.6万家此类公司(约占总数的3.7%)。• 对照组: 数据集中所有其他未表现出明确AI采纳迹象的公司。通过对比这两组公司在AI爆发(2023年第一季度)前后的招聘行为变化,研究得以精准地剥离出AI的净影响。 2. 核心研究发现 2.1 “剪刀差”效应:初级岗位的增长停滞与衰退数据显示,从2015年到2022年中期,初级岗位(Junior-level)和高级岗位(Senior-level)的就业增长曲线基本同步。然而,自2022年中期开始,两条曲线分道扬镳: • 高级岗位: 就业人数持续昂首向上。 • 初级岗位: 增长开始停滞,并在2023年中期转为下降。这种入门级工作突然“不香了”的现象,其发生时间点与ChatGPT的发布和生成式AI的兴起完美契合,构成了AI冲击就业市场的初步证据。 2.2 AI采纳对初级岗位的直接冲击。 • 在AI爆发后,采纳AI的公司的初级岗位就业人数,相对于对照组公司,出现了断崖式的下跌。 • 在AI扩散的六个季度后,这一就业差距拉大到了7.7%。 • 与此同时,高级岗位的就业在两组公司中并未出现负面差异,AI采纳者公司的高级岗位增长甚至更为强劲。结论明确:在相同的宏观经济环境下,那些深度拥抱AI的公司,正是那些正在对年轻人和初级求职者关闭大门的公司。 2.3 冲击机制:隐蔽的招聘冻结而非裁员 论文进一步探究了AI“抢工作”的具体方式,发现其过程比预想的更为隐蔽。通过将公司人员变动拆解为新招聘(Hires)、离职(Separations)和内部晋升(Promotions)三个部分,研究得出: • 离职率未上升: AI采纳者公司并未因使用AI而大规模裁掉现有的初级员工。裁员涉及的补偿、沟通和公关成本较高。 • 招聘量暴跌: 初级岗位的萎缩主要源于新招聘的停止。与对照组相比,AI采纳者公司在2023年第一季度后,平均每个季度少招了3.7个初级员工。对于招聘规模较大的AI公司,这相当于初级岗位的招聘量暴跌了约22%。这种“不招了”的策略成本更低,过程更隐蔽。它不会引发大规模裁员的新闻,但实际上正在逐渐抽掉年轻人职业生涯的第一级阶梯。 2.4 行业差异:批发与零售业成重灾区 AI对初级岗位的压缩效应普遍存在于所有行业,但程度各不相同。 • 普遍影响: 互联网、软件、设计等行业均受到显著影响。 • 重灾区: 真正的重灾区是批发和零售业。在该行业,拥抱AI的公司,其初级岗位的招聘数量比不拥抱AI的公司,每季度减少了将近40%。 • 原因: 这与直觉相符,因为该行业存在大量与文员、客服、导购相关的简单、重复性任务,而这些正是AI最擅长替代的领域。 2.5 学历的“U型曲线”:中层毕业生的困境 研究对不同等级大学(Tier 1-5,从顶尖名校到普通地区性大学)毕业生的就业情况进行了分析,发现了一个清晰的“U型曲线”: • 曲线一端(Tier 1): 来自哈佛、斯坦福等最顶尖名校的毕业生,受到的负面影响相对较小。他们的核心优势在于解决复杂问题的能力,这是AI难以替代的。 • 曲线另一端(Tier 5): 来自最普通大学的毕业生,受到的影响也非常小。他们的核心优势在于人力成本低,薪资要求不高。 • 曲线底部(Tier 2 和 Tier 3): 遭受打击最沉重的是来自中上等、但非顶尖大学的毕业生。这个群体薪资要求不低,但其从事的许多工作又恰好落入AI可替代的范围,形成了“高不成、低不就”的尴尬局面,成为最容易被优化的群体。 3. 个人应对策略与启示 这份研究揭示了一个残酷的现实:曾经熟悉的、一级级向上攀登的职业阶梯,其底部正在被AI迅速抽走。对此,个人需要采取主动策略以应对挑战。 3.1 策略一:尽快完成原始积累,向上跃迁由于AI正在极速追赶,个体必须迅速摆脱初级工作状态,成长为能独立承担复杂任务的“老兵”。 • 主动承担复杂任务: 有意识地避免沉迷于舒适区内的简单工作,因为那正是AI的领地。 • 设定明确目标: 目标应是在最短时间内,让工作内容中AI不可替代的部分超过50%。 3.2 策略二:思考什么是你的“暗知识”和元技能AI颠覆的不是掌握“What”(公共知识)的人,也不是掌握“How”(执行方法)的人,而是放大了掌握“Why”(深层原因)的人。 • 发掘“暗知识”: “暗知识”被定义为“只有你才能提供上下文的知识”。个体需要思考,在自己的具体工作中,有哪些是自己能独特定义的上下文。这是AI难以企及的优势。 3.3 策略三:向你的兴趣要投资回报率(ROI)过去被视为“软技能”或“加分项”的能力,正在迅速成为必需品。 • 重视非传统技能: 品位、审美、幽默感、同理心、共情能力、感染力和领导力等,是AI暂时无法触达的区域。 • 从兴趣中寻找“心力”: 找到那些即使不付钱也乐在其中的事情。这些兴趣是个人“心力”的重要来源,与AI结合可能会催生新的职业机会和竞争力。 4. 结论谷歌DeepMind首席执行官Demis Hassabis曾表示,AI对就业市场的潜在影响是“可怕的”(scary),但他也预言AI将带来“激进富裕”(Radical Abundance)的时代。这份哈佛大学的研究报告为前一个论断提供了坚实的数据支撑。对于每一个职场人而言,如何在这场从“可怕”向“富裕”推进的时代浪潮中不被抛弃,是一个必须严肃思考和积极应对的命题。 如果希望和主播建立联系/加入听友群,可加微信bonewe2004! 关于主播: 加入听友群,请扫二维码

5分钟
93
1个月前

美国AI巨头断供,CEO曾是百度员工

AI圆桌π

主要事件与背景 2025年9月5日,美国人工智能巨头Anthropic(顶级大模型Claude的母公司)突然宣布,将全面终止向中国及相关地区的用户提供服务。 范围广度: 不仅包括中国境内的企业和用户,还涵盖全球各地由中国资本直接或间接控股超过50%的企业,无论其注册地。 严格程度: 这是目前美国AI巨头公司公开对中国下达的最严格禁令,甚至比OpenAI此前的限制更为严厉。 时间节点: 此禁令发布前两天,Anthropic刚刚完成130亿美元的F轮融资,估值达到1830亿美元,跃居全球第四大独角兽公司,仅次于Space X、字节跳动和OpenAI。 Claude的行业地位 编程领域: Claude在编程领域长期占据主导地位,被许多开发者认为是“体验最好的编程工具”。 综合排名: 在2024年7月发布的全球AI大模型综合排名中,Claude 3.7 Sonnet以总分第二的成绩紧随GPT-4.5之后,尤其在“编程能力和长文档处理能力”方面优势突出。 财务表现: 截至2024年8月,Anthropic的年化营收已突破50亿美元,7个月内增长5倍,主要收入来源于编程工具。 CEO背景与禁令动因分析 百度经历: Anthropic的联合创始人兼CEO达里奥・阿莫迪(Dario Amodei)曾于2014-2015年在百度担任研究科学家,与吴恩达共事。 早期灵感: 达里奥曾在播客中提到,他对“AI模型扩展法则”的直觉最早来源于在百度的研究,这直接影响了Claude的技术路线。这表明其对中国企业并无“公报私仇”的动机。 禁令的潜在动因 国家安全风险: Anthropic公告中提及的“国家安全风险”是主要原因。 美国国防部合同: 2024年7月14日,Anthropic与美国国防部签署了一份为期两年、总额最高2亿美元的合同。 白宫晚宴事件: 在近期举办的白宫科技领袖座谈会上,Anthropic作为美国AI顶尖公司却未受邀,而谷歌、苹果、OpenAI等均受邀。这引发了外界对其“搞投名状,表忠心”的猜测。 模型蒸馏技术转移: 公告中还提到“防止敌对国通过模型蒸馏技术转移其能力”,即防止将大型复杂模型的核心能力压缩到轻量模型上,以大幅降低计算成本并保持高性能。然而,目前尚未有国内模型被证实通过蒸馏Claude模型。 中国AI产业的应对与机遇 Anthropic的禁令对中国AI企业而言,与其说是挑战,不如说是一场机遇。中国AI公司的积极响应 智谱AI: 率先推出“Claude难饭”的“搬家计划”,帮助企业无缝迁移代码生成、文档处理等核心功能。 商汤科技: 紧随其后,为受影响用户提供日日新大模型的“搬家服务”,并赠送5000万Tokens体验包以降低迁移成本。 中国AI新模型表现强劲 月之暗面 Kimi K2: 重点强化了编程能力和长上下文支持,并宣布兼容Claude Code的开发生态。官方宣称在“代码生成和错误修复等能力上已超越Claude的某些版本”。 阿里巴巴 通义千问 Qwen3-Max-Preview: 发布了史上最大模型,号称在性能上“打败了Claude Opus 4在内的国内外劲敌”。 全球排名: 2024年8月底,硅谷知名风投a16z发布的最新全球AI百强榜中,前50名有22家中国公司上榜。其中,DeepSeek排第三,夸克排第九,而Claude排第七。 影响与展望 加速技术自主化: 此次禁令将加速中国AI产业的技术自主化进程。 提升国际竞争力: 这将推动国产大模型在全球竞争中占据更有利的地位。中国AI公司正迅速崛起,不仅能填补Claude留下的市场空白,更有望在技术上实现超越。 总结 Anthropic禁令,是美国AI巨头对中国下达的最严厉限制。尽管其动因可能涉及美国政府压力和国家安全考量,但中国AI产业并未因此受挫。相反,这刺激了国内企业加速创新和自主研发,智谱AI、商汤科技、月之暗面和阿里巴巴等迅速推出替代方案和更强大的新模型,展现了中国AI在技术实力和市场应对上的强大韧性。此事件将成为中国AI技术发展的一个重要转折点,加速其在全球舞台上的崛起。 如果希望和主播建立联系/加入听友群,可加微信bonewe2004! 关于主播: 加入听友群,请扫二维码

4分钟
23
2个月前
AI圆桌π的评价...

空空如也

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧