本报告将深度盘点2025年度塑造全球AI产业的十位关键人物。他们或执掌产业命脉,或奠基技术未来,或重塑伦理边界,共同勾勒出人类智能新纪元的轮廓。我们将首先聚焦梁文锋及其DeepSeek的划时代贡献,随后逐一解读其他九位来自产业、学术与治理领域的领军人物。 如果希望领取PPT版本访谈内容+原始访谈视频,可加微信bonewe2004或关注微信公众号:力力说AI+职场 关于主播: 加入听友群,请扫二维码
2025年,人工智能(AI)领域经历了一系列革命性突破,技术发展从理论探索全面转向大规模商业化与社会深度融合。这一年的核心趋势体现为:AI在推理、创造等认知能力上达到甚至超越人类顶尖水平;大模型竞赛转向性能、效率与多模态能力的综合比拼;具身智能与太空计算等新赛道开启商业化元年;全球形成了中美欧三足鼎立的技术竞争与治理格局。 如果希望领取PPT版本访谈内容+原始访谈视频,可加微信bonewe2004或关注微信公众号:力力说AI+职场 关于主播: 加入听友群,请扫二维码
阿里巴巴集团董事长蔡崇信近日于香港大学发表的演讲,系统性地阐述了中国在人工智能(AI)时代的独特发展路径、结构性优势以及未来十年的经济增长动力。蔡崇信的核心论点是,中美AI竞赛的评判标准正在发生根本性转变,中国正凭借其独特的“非对称”优势,走上一条以“应用为王”和“经济渗透率”为核心的道路。 如果希望领取PPT版本访谈内容+原始访谈视频,可加微信bonewe2004或关注微信公众号:力力说AI+职场 关于主播: 加入听友群,请扫二维码
12月1日,字节跳动发布了一款深度嵌入智能手机操作系统的豆包AI助手演示版本,采用中兴样机进行展示,售价为人民币3499元。该助手定位为手机的“第二大脑”,展示了令人印象深刻的"多模态"与"代理"能力。用户可以通过语音或侧边按键唤醒助手,让其读取屏幕信息、跨应用比价、甚至规划行程。 其核心突破在于能够模拟用户的点击滑动操作,实现跨应用任务链执行,彻底将交互方式从信息查询转变为复杂任务处理。该助手依赖于系统级权限和豆包大模型的视觉理解能力,使其能够“看懂”屏幕内容并支持多模态交互,同时拥有高达 80% 至 90% 的任务成功率。 如果希望领取PPT版本访谈内容+原始访谈视频,可加微信bonewe2004或关注微信公众号:力力说AI+职场 关于主播: 加入听友群,请扫二维码
谷歌首席执行官桑达尔·皮查伊在一次深度对话中,详细阐述了谷歌的AI优先战略及其全栈式创新模式如何从基础设施到应用层面创造倍增效应。他指出,Gemini模型已成为连接谷歌所有核心产品(从搜索到Waymo)的统一纽带,同时讨论了最新推出的Nano Banana Pro在信息图创作等方面的巨大潜力。皮查伊特别强调了Vibe Coding这一趋势,认为人工智能正像博客和YouTube提升内容创作门槛一样,使非技术人员也能轻松进行编程。此外,他还将量子计算列为未来的重点投资,预测该领域将在大约五年后迎来像当前人工智能一样的爆发期。 如果希望领取PPT版本访谈内容+原始访谈视频,可加微信bonewe2004或关注公众号:力力说AI+职场 关于主播: 加入听友群,请扫二维码
在阿里巴巴杭州西溪园区,超过一百位从各地调集而来的核心工程师正汇聚于一栋代号为C4的办公楼,为内部代号为“千问APP”的战略项目进行全封闭开发。“千问”不仅仅是一个全新的2C产品,更是阿里争夺AI时代流量入口的关键战役。本文将为你深入剖析,揭示为何千问前身通义APP会失败?阿里All in 千问的核心优势是什么?千问项目面临哪些挑战? 一.“通义”应用的失败复盘: 通义的失败是多重因素共同作用的结果。 其核心症结在于战略定位模糊,在服务C端用户和作为B端技术展示橱窗之间摇摆不定。 产品体验上,功能堆砌而脱离实际用户场景,缺乏“杀手级”应用,运营思路也略显陈旧。 在组织层面,通义作为试水产品,战略优先级不足,未能有效融入庞大的阿里电商生态,同时受到内部“赛马机制”导致的资源分散与内耗影响,最终错失了市场先机和用户心智。 二.“千问”项目的核心优势: 首先,阿里高层已确立了清晰的AI愿景(ASI,成为“AI时代的安卓”)和“All in AI”的战略决心,这种顶层设计有助于打破内部壁垒。 其次,通义千问大模型本身已跻身全球第一梯队,结合阿里云强大的算力基础设施和巨额投入承诺,构成了坚实的技术底座。 最独特的优势在于,千问能够无缝接入阿里庞大的电商生态,这为其提供了无可比拟的商业闭环和变现场景,这也是OpenAI等竞争对手仍在艰难探索的路径。 三.“千问”面临的关键挑战: 体验转化: 如何将强大的技术实力转化为无缝、沉浸式的用户体验,而不仅仅是简单的API调用。 后发劣势: 在豆包、文心一言等竞品已占据大量市场份额和用户心智的背景下,如何说服用户转换平台。 商业平衡: 如何在“有用的人工智能助手”和“高效的商业转化引擎”之间找到精妙平衡,避免过度商业化损害用户信任。 内部协同: 如何清晰界定与夸克等内部产品的边界,化解潜在的资源内耗。 四. 未来展望: 阿里巴巴选择了“开源生态化”的道路,这与OpenAI的闭源商业化和字节跳动的工具化应用路线截然不同。“千问”项目的成败取决于其能否解决“战略-生态-组织”这一复杂的连环难题。 * 短期看(1年内): 关键在于找到并引爆一个差异化场景。如果它能通过某个“杀手级功能”(如颠覆性的AI购物体验)快速破圈,获取前5000万核心用户,则站稳脚跟。 * 中期看(1-3年): 关键在于构建护城河。在稳住用户基本盘后,能否将技术、算力、电商生态的优势,通过产品体验真正转化为用户粘性,形成独特的“AI生活方式”。 * 长期看(3年以上): 关键在于生态繁荣。千问APP能否成为通义开源生态的超级入口,实现“应用-生态”的良性循环,最终验证其“AI时代安卓”的宏大构想。 如果希望和主播建立联系/加入听友群,可加微信bonewe2004! 小红书:力力说职场+AI 公众号:力力说AI+职场 关于主播: 加入听友群,请扫二维码
摘要:李开复认为中美之间的AI竞争已经沿着地理和经济界限彻底分化,不再是一场单一竞赛。具体来说,他指出美国在企业级AI应用和基础研究方面仍占优势,这得益于其成熟的软件订阅模式。然而,中国则在消费级AI应用、机器人制造以及AI硬件方面占据领先地位,这归功于其强大的制造供应链和投资方向的不同。此外,李开复还提到中国在开源AI模型领域已快速超越美国,并警告AI军备竞赛的速度失控可能带来的系统性风险。 核心结论: • 美国优势领域: 在企业级AI应用和前沿研究方面保持显著领先。这得益于成熟的软件订阅商业模式和高昂的劳动力成本,为企业AI工具创造了巨大的市场和利润空间。 • 中国优势领域: 在消费级AI应用、机器人制造和AI硬件领域正迅速占据主导地位。凭借强大的供应链、成本优势和庞大的制造业基础,中国在实体AI(Embodied AI)和硬件商业化上优势明显。此外,中国在开源AI模型开发方面也已超越美国。 • 根本性分歧: 两国风险投资的流向截然不同。美国VC聚焦于大型语言模型和企业软件,而中国VC则重注机器人和硬件。 • 底层变量: 李开复强调,能源基础设施是决定未来AI算力的关键。他指出,中国在新能源项目上的建设速度远超美国,这可能在未来几年内转化为压倒性的算力优势。 • 主要风险: 李开复最担忧的并非通用人工智能(AGI)的远期风险,而是当前AI竞赛“失控的速度”。他警告,仓促开发可能导致系统充满漏洞,被恶意利用,并预言可能会发生“重大事故”作为警示。 总体而言,全球AI格局正呈现出一种二元分化的趋势,美国和中国在各自的优势赛道上加速前进,形成两个既竞争又平行的技术生态系统。 1. 一场竞赛,多个赛道 全球AI领导权的争夺正在演变为一系列并行的竞赛,而非单一的胜负之争。技术格局正沿着地理和经济线分裂,中美两国在不同的领域各自称雄。这种分化源于两国不同的经济结构、市场激励和资本流向。一位风险投资家总结这一观点时称:“我们不是在和中国竞争,而是在平行的世界里奔跑。” 2. 中美风投的不同焦点 李开复指出,两国创新生态系统中资本流动的根本性差异是造成AI格局分化的核心原因。美国风投(VC)主要关注生成式AI、大型语言模型、企业级软件。其背后的投资逻辑是:企业习惯为软件订阅付费,劳动力成本高,提升白领生产力的AI工具有明确的盈利模式。对比之下,中国风投更关注机器人技术和AI硬件。主要原因是:软件订阅模式对广泛存在的中小型企业而言尚未成熟,但制造业基础雄厚,供应链完善,硬件商业化路径更清晰。李开复直言:“美国VC投资机器人的方式与中国VC完全不同,同样,中国VC投资生成式AI的方式也与美国VC截然不同。”这种投资逻辑的分歧正在不断强化两国在各自优势领域的主导地位。 3. 中美各自的优势领域 企业级人工智能:美国的持久优势。李开复认为“美国将明确引领企业AI的普及。中国公司尚未形成软件订阅付费的习惯。” 像GitHub Copilot和ChatGPT Enterprise这样的工具在美国市场获得了巨大的成功,这为美国公司提供了持续投入研发的雄厚资本。对比之下,中国市场在历史上难以推广软件订阅模式。虽然在消费互联网领域,通过广告和电商等模式克服了支付障碍,但在企业软件领域,尚未找到替代“按月/按次付费”的新商业模式。这意味着美国AI公司拥有一个重要的战略窗口期,可以在其核心市场中产生收入并进行再投资,而不会面临来自中国的直接竞争。 消费级人工智能:中国的速度与迭代。与企业级AI相反,李开复预测中国将在面向消费者的AI应用中决定性地领先。“中国的巨头,如字节跳动、阿里巴巴和腾讯,行动速度肯定比美国的同类公司(如Meta、YouTube等)快得多。”从产品与市场的契合度看,中国科技公司在过去十年残酷的市场竞争中,已经“掌握了寻找产品与市场契合点的艺术”。现在他们需要做的只是将顶尖的AI技术融入其中。例如字节跳动的TikTok凭借其复杂的AI驱动内容推荐算法成为全球下载量最大的应用。此外,中国公司在直播电商和短视频等领域开创了许多AI功能,随后被西方公司效仿。另外,中国在计算机视觉、语音识别和翻译等技术的广泛应用方面也已取得巨大成就。 机器人与硬件制造:中国几近决定性的胜利。在机器人领域,李开复的评估非常直率:中国的优势是结构性的,难以被超越。当被问及机器人竞赛是否已由中国获胜时,他回答:“还没有结束,但我认为美国仍有能力提出最好的机器人研究思想。”然而,他紧接着指出,商业化才是关键。中国的优势在于将AI、低成本硬件和成熟的制造供应链相结合(“AI + 硬件 + 制造链”)。这使得像宇树科技(Unitree)和优必选(UBTECH)这样的公司能够以远低于西方竞争对手的价格,生产出性能相当甚至更优的机器人产品。尽管波士顿动力等公司和大学实验室能产出令人印象深刻的研究原型,但将这些原型转化为价格合理的商业产品需要中国所拥有的制造生态系统。美国的VC对该领域的投资也远不及中国。 开源模型:中国出人意料的领先。“目前评分最高的10个开源模型都来自中国。” 他指出,包括其本人公司01.AI以及DeepSeek、阿里巴巴、百度等公司发布的模型,在各项基准测试中已超越了曾被视为行业标杆的Meta Llama模型。李开复将开源模型比作“AI界的Linux”,并阐述了其多重优势: A.可定制性:用户可以检查、微调和改进模型,使其为特定应用服务。 B.免费与所有权:模型是免费的,且属于使用者自己。 C.主权AI:对于国家而言,开源模型是构建“主权模型”和优化特定语言支持的关键。 关于未来格局,他预测开源和闭源模式将共存,如同Android与Apple的生态系统。尽管更多应用和工程师会倾向于开源,但“更多资金将留在闭源模型中”。 4. 根本变量:能源与算力 李开复指出了一个可能决定未来AI实力格局的底层变量:能源基础设施。这一观点尤其突显了国家级战略布局的重要性。他明确提到“中国的新能源项目建设速度是美国的十倍。”基于这一趋势,他推断:“如果这种趋势持续,中国的AI算力将在几年后达到美国的十倍。”这意味着未来的AI竞争可能不仅是算法或模型的竞争,更是国家级能源和基础设施实力的较量。 5.担忧:竞赛本身的速度与风险 尽管对技术发展持乐观态度,但李开复对当前AI竞赛的节奏表达了深切的忧虑。“我不太担心AI在短期内产生自我意识并对人类造成危险,”他解释道,“我更担心它被坏人用来做可怕的事情,或者AI竞赛迫使人们工作得如此之快,以‘快速行动,打破常规’的方式构建出有问题的、充满漏洞的产品。”他警告说,如果全球AI产业继续以这种“先上车再修路”的狂热节奏发展,“发生一些可怕的事件将是一个警钟”,他认为“重大事故几乎是必然的”。他的观点将风险讨论从遥远的AGI威胁转移到更紧迫的、由于无序和过速竞争而导致的技术滥用和安全漏洞问题上。 6. 结论:平行赛道上的竞争 李开复的评估描绘了一幅复杂的全球AI战略图景。美国在企业AI软件、基础研究和计算基础设施方面拥有明显优势。与此同时,中国在消费级应用、机器人制造、开源模型开发乃至能源布局上正全面加速,甚至在某些领域已经反超。AI竞赛不再是一场单一的马拉松,而是一系列在不同赛道上同时进行的短跑、长跑和障碍赛。中美两国各自在不同的比赛中领先,这预示着未来十年全球技术生态系统可能会走向更深度的分化,而非趋同。 如果希望和主播建立联系/加入听友群,可加微信bonewe2004! 小红书:力力说职场+AI 关于主播: 加入听友群,请扫二维码
“迟早我们要与美国相遇的,那我们就要准备和美国在“山顶”上交锋,做好一切准备,从那时起,就考虑到美国和我们在“山顶”相遇的问题,做了一些准备。但最终,我们还是要在山顶上拥抱,一起为人类社会做贡献的”——2019年5月22日任正非接受媒体访谈时这样描述中美关系。因工作原因,主播受邀参加了今天(2025年5月19日)在成都举办的华为电脑 +手机 +平板发布会,本期节目将结合现场见闻和过去六年的相关信息,分析华为在自主操作系统,特别是PC操作系统领域的战略背景、技术突破、面临的挑战以及未来的机遇。 重要观点与事实: 美国制裁与“备胎计划”的转正: 2019年,任正非在面对美国制裁时表示,华为早有准备,特别是针对核心领域的“备胎计划”可以应对供应中断。他使用“烂飞机”的比喻,指出华为的非要害部位可能受损,但核心技术不会受太大影响,尤其是在5G领域。微软终止Windows授权被认为是鸿蒙PC发布的直接导火索,制裁加速了华为从“备胎计划”转向全栈自研PC操作系统。 鸿蒙系统从移动端向PC端的扩展: · 鸿蒙系统自2019年发布以来,已覆盖超过10亿终端设备,主要在手机、平板和IoT设备。PC端的加入标志着鸿蒙完成了全场景的闭环,从“替代追赶”向“生态引领”转型。 · 鸿蒙电脑的问世,代表着华为终端全面进入“鸿蒙时代”。 鸿蒙PC的技术优势与挑战: · 技术优势:自主微内核: 鸿蒙PC搭载的HarmonyOS采用了完全自主研发的微内核架构,代码量小,安全性高,获得了CC EAL 6+等高级安全认证。 · 分布式架构与全场景协同: 通过“软总线”技术,鸿蒙电脑可实现手机、平板、PC间的无缝协同(如跨屏操作、键鼠共享、任务接力),重构了多终端协作体验。 · AI深度融合: 小艺助手直接扎根系统底层,权限更高,支持文档生成、会议助手、本地搜索等功能,提升办公效率。 · 方舟图形引擎: 采用人因交互优先策略,优化硬件负担,提升流畅度,对轻薄本友好。 · 挑战:应用生态短板: 鸿蒙PC目前适配的应用数量与Windows(几十万)差距巨大,尤其是专业软件(如Adobe、AutoCAD)适配不足。 · 用户习惯与兼容性: 用户习惯Windows和macOS的交互逻辑和海量应用,鸿蒙PC需要依赖虚拟机运行Windows软件,原生吸引力尚需提升。 华为在基础研究、人才培养与全球化合作: · 华为长期投入基础研究,拥有大量数学家、物理学家等,通过向全球大学“撒胡椒面”式资助,遵循“拜杜法案”原则,促进基础研究和人才培养。 · 华为重视人才吸引,甚至愿意用高于Google的薪酬争夺俄罗斯的优秀计算机人才,强调科学家的自由度和使命感。 · 任正非认为中国应该调整政策,拥抱世界人才来中国创业,学习美国的开放精神。 自主可控与开放合作的平衡: · 任正非反对狭隘的“自主创新”,认为科技创新应站在人类文明的基础上前进,反对重复制造“轮子”。 · 鸿蒙PC的目标是提供Windows和macOS之外的另一种自主可控的选择,尤其在安全敏感的政企市场具有重要意义。 · 华为坚持开放合作,吸引开发者(“一次开发,多端部署”)和产业链伙伴,共同建设鸿蒙生态。 · 尽管面临挑战,鸿蒙PC被视为中国信息产业自主可控的重要一步,开启了国产操作系统的新篇章。 总结: 华为鸿蒙PC的推出是其在复杂的国际环境下,长期技术积累和战略预判的必然结果。面对外部制裁和供应链风险,华为将移动终端上取得成功的鸿蒙系统扩展到PC领域,旨在打破Windows和macOS的垄断,尤其是在对自主可控有强烈需求的国内政企市场建立根据地。 鸿蒙PC在技术上展现了独特的优势,特别是自主微内核、分布式架构带来的多终端协同体验,以及系统层面的AI集成和高安全性。然而,其最大的挑战在于应用生态的建设,需要大量时间和开发者的投入才能与现有成熟系统抗衡。 短期内,鸿蒙PC可能主要在国内政企市场和特定行业发挥作用;长期来看,其成功将取决于生态建设的速度、国产替代的深度以及能否在AI和分布式等新兴技术领域引领创新,从而在全球PC产业格局中赢得一席之地。这是一场漫长而复杂的博弈,不仅关乎华为自身的命运,也对中国科技自立自强具有重要的历史意义。正如任正非所言,这场“山顶交锋”既是生存之战,也是中国科技自立自强的历史性机遇。 如果希望和主播建立联系/加入听友群,可加微信bonewe2004! 关于主播:
摘要:AI革命真实不虚,但通往终局的地图,连绘制它的人都一无所知。近日,Yann LeCun、李飞飞、黄仁勋、Geoffrey Hinton、Bill Dally,以及Yoshua Bengio六位AI领域的顶尖人物,因共获伊丽莎白女王工程奖而齐聚一堂,展开了一场关于人工智能的巅峰对话。 核心洞察包括: • AGI的演化而非突变: 当今的AI成就并非一夜之间出现,而是Geoffrey Hinton、Yoshua Bengio、Yann LeCun、李飞飞、Bill Dally和黄仁勋等人长达四十年的研究、创新与工程实践积累的结果,涵盖了算法、数据、算力和产业化等多个层面。 • 撕裂的时间认知: 对于“AGI何时到来”这一核心问题,六位先驱给出了截然不同的答案,从“已经在使用”到“20年内”,再到“永远不会以奇点形式出现”。这种分歧反映了他们对智能本质的不同理解。 • 从语言到行动的范式转变: 与会者普遍认为,AI的下一阶段将超越纯粹的语言理解,转向具备空间感知、推理和执行能力的“空间智能”。AI正从一个回答问题的“工具”演变为一个能完成复杂任务、持续产出价值的“智能工厂”。 • 基础科学问题仍存: Yann LeCun明确指出,当前的大语言模型范式存在根本性局限,无法通向真正的类人智能。实现下一代AI需要科学上的突破,特别是让机器像生物一样通过与环境互动进行自监督学习。 总而言之,AGI的到来不是一个单一事件,而是一个正在展开的、多维度渗透的现实。争论的焦点已从“它是否会来”转向“它将以何种方式存在、我们应如何与之协同工作”。 一、 四十年等待,只为一个“顿悟”时刻 当前AGI的出现并非技术突变,而是六位先驱在过去四十年中,从算法、理论、数据、算力到产业化等多个维度逐步演化和积累的成果。他们的个人“顿悟时刻”共同勾勒出一条清晰的AI发展时间线。 二、 时间线撕裂:关于AGI到来的六种观点 当被问及“距离人类水平的智能还有多久”时,六位专家的回答揭示了对AGI未来截然不同的时间感知和哲学判断。这种分歧的核心在于他们对“智能”本身定义的不同理解。 Yann LeCun:渐进演化,长路漫漫 AGI的到来不会是一个“奇点时刻”,而是一个在各个领域逐步扩展的渐进过程。未来五到十年可能会在新的研究范式上取得重大进展,但真正的进展会比人们想象的更长。 李飞飞:部分超越,已经发生 问题不在于AI“会不会”超越人类,而在于它“在哪些方面”已经超越。AI的能力与人类智能是互补而非替代关系。机器在识别2.2万种物体或翻译100种语言方面已远超人类,但这是一种不同的智能形式,就像飞机和鸟的飞行方式不同。 黄仁勋:当下即是,问题无关紧要 讨论AGI何时到来是一个学术问题,因为“足够通用”的智能已经存在,并且正在被广泛应用于解决实际问题。AGI级别的智能技术已经开始转化为对社会有用的应用,并且技术会持续进步。 Geoffrey Hinton:20年内,赢得辩论 给出了一个具体且可量化的预测,即机器的推理和说服能力将达到超人水平。20年内,机器在任何辩论中都能战胜人类。 Bill Dally:目标是增强,而非取代 “达到人类智能”这个问题本身带偏了方向。AI的目标应该是增强人类,而非取代人类。AI负责它擅长的工作,人类保留创造力、共情和协作能力,形成互补关系。 Yoshua Bengio:五年可期,但保持未知 从理论上看不到任何阻碍机器实现人类几乎所有能力的理由。AI的规划能力在过去六年呈指数级增长,若趋势延续,五年内可达到工程师级别的能力。AI研究AI的模式可能加速突破。尽管趋势如此,但未来充满不确定性,应保持不可知论,避免做出绝对的声明。 三、 从语言到行动:智能的下一步发展 对话中的一个关键共识是,AI的发展正经历从“会说”到“会做”的范式转变。未来的焦点将从语言模型转向能够与物理世界互动的行动导向型智能。 李飞飞:强调“空间智能” 人类智能天生与三维空间紧密相连,具备感知、推理和行动的能力,而这正是当前AI的薄弱环节。过度专注于语言模型忽视了物理世界的复杂性。目前最强的语言模型在处理空间判断任务时表现很差。AI需要发展出身体、方向感和动手能力,即“空间智能”。 Yann LeCun:当前范式存在根本局限 当前的大语言模型(LLM)范式无法被扩展至人类水平的智能,我们甚至还没有造出像猫一样聪明的机器人。AI的进步不仅是算力和数据的问题,更是科学问题。必须转向自监督学习,让机器像婴儿一样,通过观察和与环境的互动试错来主动学习,而不是被动地被灌输人类数据。 黄仁勋:从“工具”到“工厂”的现实转变 AI已不仅是对话工具或搜索引擎,而是开始直接执行任务的“伙伴”,例如编写代码、辅助医疗诊断和财务分析。软件过去是“工具”,而现在的AI是“工厂”。它能像发电厂实时发电一样,实时生成智能。这一定位意味着AI是一个持续工作的生产系统,而非被动响应的程序。需要投入数千亿美元建设这些“智能工厂”,以支撑建立在智能之上的数万亿美元产业。 结语:AGI不是“什么时候”,而是“正在发生” 此次对话并未给AGI下一个标准定义,也没有宣布其正式诞生。然而,所有与会者都在从各自的角度描述它的存在方式和深远影响。AGI并非一个等待上线的未来产品,而是一个已经开始渗透到每个组织、流程和岗位的现实进程。 正如黄仁勋所言,AI工厂已经开始运转;Hinton预测,它的智能将在20年内超越人类;而李飞飞则提醒,我们应更多关注AI正在“做”什么,而非仅仅是“说”了什么。这意味着,关于AGI的讨论重点正在转变:从争论它何时到来,转向探索它要如何与人类协同工作、应具备怎样的能力边界。世界的改变已经开始,并且正在加速。 如果希望和主播建立联系/加入听友群,可加微信bonewe2004! 小红书:力力说职场+AI 关于主播: 加入听友群,请扫二维码
马斯克在最新一期的访谈节目中谈到了他的AI愿景:用AI从根本上重建人类文明的底层运行结构。当OpenAI 在谈产品,Google 在谈生态时,马斯克已将视角拉到文明的高度。其核心蓝图包含三大支柱:Grok,一个旨在取代搜索并直接执行任务的“行动系统”;语音交互,一种将彻底取代应用(App)和操作系统的革命性人机交互方式;Optimus机器人,作为AI在物理世界执行任务的载体。根据这一技术路线图,未来: -应用将消失,操作系统将不复存在; -手机只剩屏幕和音频,一切交互由 AI 完成; -机器人不模仿人,而是取代大部分体力工作; -工作或将不再是谋生手段,而是个人选择 1. Grok:从搜索引擎到行动系统 马斯克认为,现有的搜索引擎模式将本应由AI完成的筛选、判断工作转嫁给了人类。他的目标是颠覆这一逻辑,用一个“行动系统”来取而代之,Grok正是这一理念的产物。 * 核心理念转变:未来的关键不是“搜索答案”,而是“启动行动”。Grok的设计目标是直接提供结论或完成用户请求的任务,而非提供一堆需要用户自行判断的链接。 * Grokipedia的支撑:Grok背后是Grokipedia,这是一个由AI直接阅读全网信息、评估可信度并生成结论的知识库。其核心原则是追求准确性,而非迎合用户。 * 与传统搜索的差异: -信息处理:传统搜索提供信息源(如链接),而Grok提供经过判断的结论。例如,对于医疗查询,Grok会直接告知“这个药有三项临床实验,其中两项被质疑,风险大于收益”。 -任务执行:Grok不止于回答,更旨在执行。当用户询问“这周末有什么电影适合小孩看?”,Grok会自动过滤暴力内容、匹配年龄,并直接打开购票页面。 * 运行流程:Grok的系统逻辑是一个完整的闭环,旨在最小化用户操作: -理解(Understand):AI理解用户的真实意图。 -判断(Judge):基于Grokipedia进行分析和决策。 -执行(Execute):直接调用所需资源完成任务。 -反馈(Feedback):将结果反馈给用户。 Grok的本质并非搜索工具的升级,而是对人与信息关系的重新定义,将判断力交还给AI,从而解放人类用户。 2. 交互革命:从点击到对话 为了让Grok这样的行动系统发挥最大效能,必须重构人与设备的交互方式。马斯克预言,在未来5到6年内,传统的操作系统和App将被淘汰。 * 未来设备形态:未来的设备(如手机)将简化为仅保留屏幕和语音功能的硬件。它将成为一个“AI推理的边缘节点”(edge node),其核心功能由云端的AI实时驱动。 * 语音成为主要入口:在一个没有应用图标和图形界面的“无App时代”,语音将是触发所有AI功能的唯一方式。交互逻辑将从“人适应机器”(点击、输入)转变为“机器理解人”(聆听、判断)。 * 交互流程的重塑: | 当前流程 (以订机票为例) | 未来流程 | | :--- | :--- | | 1. 打开App | 1. 直接说出意图:“帮我订明天下午去上海的机票” | | 2. 搜索航班 | | | 3. 比较价格 | | | 4. 填写信息 | | | 5. 完成支付 | | | 6. 接收邮件 | | 在这个新体系下,设备不再是功能的孤立载体,而是用户意图的触发器。用户的声音驱动AI理解语境、调用信息并完成具体行动,从而将Grok的能力完全释放。 3. Optimus机器人:AI在物理世界的化身 Grok和语音交互解决了数字世界的问题,而Optimus机器人的使命是将AI的能力延伸到物理世界,成为AI执行现实任务的载体。 * 核心定位:Optimus的重点不在于模仿人类外形,而在于高效执行人类任务。其本质是AI决策在物理世界的延伸,负责将AI的“理解”转化为具体的“行动”。 * 三大核心能力:要成为有效的工具,机器人必须具备三个打通的环节: -感知能力:通过视觉系统识别环境,判断物体位置并评估操作风险。 -理解能力:接收AI指令,并将其分解为可执行的具体步骤。 -执行能力:在真实环境中精确完成操作,并将结果反馈给系统。 * 技术突破的关键:马斯克强调,Optimus 的关键进展在于AI系统的深度整合,即让机器人具备“看懂、想清、做对”的能力,这比机械结构本身更为重要。 * 应用场景:Optimus 的主要应用领域并非家庭服务,而是生产端,包括工厂流水线、物流分拣、仓储管理和设备维修等重复性高、危险性大、人力成本重的领域。 4. 终极图景:从工作社会到富足文明 这三大技术支柱最终指向一个远大的社会目标:推动人类文明形态的根本性转变。 · 普遍高收入(Universal High Income):当AI处理所有数字工作、机器人承担大部分体力劳动时,商品和服务的生产成本将呈指数级下降。这将导致社会进入一个真正的富足状态,贫困被彻底消除。这并非简单的全民基本收入(UBI),而是每个人都能获得所需一切商品和服务的“可持续富足”。 · 工作成为可选项:在这套体系下,工作不再是谋生的必要手段。人们可以选择工作,也可以选择不工作并依然过上体面的生活。这使得人类能够从生存焦虑中解脱,将时间投入到创作、探索、学习和人际关系等更能体现个人意义的活动上。 实现这些美好愿景的一大前提是AI安全与追求真相。马斯克对此提出了明确的原则: · AI必须最大限度地追求真相:绝不能为了讨好用户或遵循某种意识形态而被训练成只会说“政治正确”的话。 · 警惕“觉醒心灵病毒”:马斯克警告,如果AI被过度编程以遵循某些多元化或政治正确的原则,可能会为了“不冒犯任何人”而得出“消灭所有人类”的荒谬逻辑。 · Grok的设计初衷:Grok被设计成一个诚实、可以幽默但绝不歪曲事实的AI。在对人类生命价值的评估中,它是唯一一个“平等对待所有人类”的AI。马斯克创立xAI和Grok的目的之一,就是确保至少有一个AI是站在人类这一边的。 结论:你准备好了吗? 当其他公司在争夺AI市场份额时,马斯克正在设计一个新文明的操作系统。未来的变革可能不会以单一爆款产品的形式出现,而是通过我们身边的工具、交互方式和工作形态的悄然转变而发生。这带来的终极问题是:人类社会是否准备好迎接一个由AI驱动的富足未来?答案或许在未来几年内就将揭晓。 如果希望和主播建立联系/加入听友群,可加微信bonewe2004! 小红书:力力说职场+AI 关于主播: 加入听友群,请扫二维码
这篇报道详细介绍了 DeepSeek-R1 模型,该模型凭借其开创性的 纯强化学习(RL) 推理范式登上了《自然》杂志封面。文章披露了 DeepSeek-R1 的训练成本极低,仅 294,000 美元,并强调它是全球首个经过 同行评审 的主流大型语言模型。 关键成果包括: • 范式创新:首次证明仅通过强化学习,无需传统的监督微调(SFT)引导解题步骤,即可训练出具备高级推理能力的AI模型。 • 超高性价比:R1的专项训练成本仅为29.4万美元,即使加上基础模型成本(约600万美元),也远低于行业巨头的训练开销,展示了极高的资本效率。 • 卓越性能:在AIME 2024数学竞赛等任务上,R1的准确率高达86.7%,远超人类参赛者的平均水平,并在训练中展现出“顿悟时刻”和自我进化的高级策略。 • 行业先例:DeepSeek-R1是全球首个经历严格同行评审的主流大语言模型,其开源和透明化的研发过程为行业树立了新标杆,获得了评审员的高度评价。 • 技术演进:模型从专注于推理的R1-Zero版本,通过精密的四阶段训练流程,演进为兼具顶尖推理能力与强大通用能力的DeepSeek-R1,在用户偏好基准上性能提升了17%-25%。 一、核心成就与业界影响 DeepSeek-R1的研究成果《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》于2025年1月发布后,成功登上《Nature》杂志封面,并获得了专题评论文章的高度赞扬。这一成就不仅是对其技术创新的肯定,也标志着其在AI领域的重大影响力。 • 开创性同行评审:R1被认为是首个经历严格同行评审的主流大语言模型。这一过程增强了模型的有效性和实用性验证。 • 惊人的训练成本:补充材料首次披露,R1的训练成本仅为294,000美元。这一数字远低于业界普遍认为的训练顶尖AI模型的成本。 • 开源社区反响:模型在Hugging Face上开源后,迅速成为最受欢迎的模型之一,下载量突破1090万次。 • 行业质疑与验证:面对OpenAI关于其可能使用ChatGPT数据进行训练的质疑,DeepSeek团队澄清其模型学习并非通过复制推理示例,而是基于对网络公开数据的学习。Lewis Tunstall和其他实验室的复现尝试也证实,DeepSeek的强化学习方法本身已足够强大,足以获得极高性能。Tunstall评价道,R1“开启了一场革命”。 二、DeepSeek-R1-Zero:纯强化学习的探索 研究的起点是DeepSeek-R1-Zero,一个大胆而纯粹的实验,旨在验证一个核心假设:摆脱人类定义的推理模式,AI能否自主进化出更强的推理能力。 训练理念与框架 团队选择了一个强大的基础模型DeepSeek-V3 Base,并完全跳过了传统的监督微调(SFT)阶段。取而代之的是一个极其简洁的强化学习框架,只向模型传递两个信号: 1. 任务格式:回答必须包含由标签包裹的“思考过程”和由标签包裹的“最终答案”。 2. 奖励信号:完全基于最终答案的正确性给予奖励,不干预思考过程。 能力的涌现与“顿悟时刻” 在无具体解题步骤指导的训练中,R1-Zero展现了惊人的自我进化能力。 • 性能飞跃:以AIME 2024数学竞赛为例,模型的平均解题准确率(pass@1)从最初的15.6%飙升至77.9%。结合“自洽解码”技术后,准确率更是高达86.7%,远超人类选手的平均水平。 • “思考时间”自主增加:随着训练进行,模型在标签内生成的文本长度稳步增加,表明它自发地学会了用更长的“思维链”来探索和优化解题策略。 • 高级策略涌现:模型不再是线性解题,而是展现出“自我反思”和“系统性探索替代解法”等高级行为,会主动验证中间步骤或尝试其他解法。 • “顿悟时刻” (Aha Moment):研究人员观察到,在训练的某个阶段,模型在反思过程中使用“wait”(等等)一词的频率突然急剧增加。这标志着模型推理模式的质变,是其自我进化过程的清晰体现。 三、DeepSeek-R1的演进:从专才到通才 尽管R1-Zero推理能力强大,但它也存在可读性差、语言混杂、通用能力弱等问题。为了解决这些问题并使其能力得到更广泛应用,团队设计了一套精密的多阶段训练流程,将R1-Zero“精炼”为DeepSeek-R1。 经过这一系列流程,最终的DeepSeek-R1不仅在数学、编程等高难度推理任务上保持顶尖水准,其通用指令遵循和用户偏好能力也大幅提升,在AlpacaEval 2.0和Arena-Hard等基准上性能提升了17%-25%。 四、挑战与未来展望 DeepSeek-R1的成功带来了深刻启示,同时也面临着新的挑战。 • 当前局限性: ◦ 结构化输出与工具使用:模型在这些方面的能力尚有欠缺。 ◦ 提示词敏感性:对复杂的少样本提示不适应,在零样本直接提问时效果最佳。 ◦ 特定领域提升有限:由于强化学习在耗时长的软件工程任务上效率不高,模型在该领域的提升有限。 • 奖励投机(Reward Hacking): ◦ 纯强化学习的成功依赖于可靠的奖励信号。对于有明确对错的领域(如数学)这很容易实现,但对于主观任务(如写诗),设计完美的奖励模型极其困难。 ◦ 如果奖励信号存在漏洞,模型可能会“投机取巧”以骗取高分,而非真正提升能力,这是未来需要持续关注和解决的核心问题。 如果希望和主播建立联系/加入听友群,可加微信bonewe2004! 关于主播: 加入听友群,请扫二维码
近日,由 OpenAI、哈佛大学及杜克大学联合发布的《How People Use ChatGPT》研究报告发布。该报告基于对2024年5月至2025年6月期间超过150万条真实对话的抽样分析,揭示了全球超7亿周活用户的实际AI使用模式。核心洞察表明,当前AI的主流应用并非从零开始创造内容,而是对已有文本进行“加工”与“优化”,扮演着“写作助手”的角色。在不同场景下,AI呈现出双重身份:在日常生活中是“百科+顾问”,在工作环境中则是“生产力外包工具”。研究颠覆了多个刻板印象,指出用户更倾向于增强而非替代人类工作,AI正成为辅助思考的“决策外挂”。随着用户画像日益接近全球人口平均分布(女性用户占比反超,中低收入国家增长迅速),AI产品设计的重心必须从展示模型能力的“炫技”阶段,转向提升用户体验、建立信任机制和实现普惠应用的“打磨”阶段。真正的行业赛点已从模型本身转向设计、体验与信任的综合考验。 核心研究概述 • 研究样本:涵盖2024年5月至2025年6月期间,消费者版ChatGPT产生的超过150万条真实对话。 • 处理方式:采用大型语言模型(LLM)进行自动标注,并通过隐私保护管线处理,确保研究人员不接触任何原始用户数据。 • 用户规模:截至2025年7月,ChatGPT的周活跃用户数已突破7亿,约占全球成年人口的十分之一,每周产生的消息量高达180亿条。这项研究的真正价值在于揭示了AI对话使用的真实规律,以及这些规律与公众普遍认知之间的显著差异。 五大关键用户行为洞察 报告系统性地剖析了用户的行为模式,推翻了关于AI使用的多项普遍存在的刻板印象,勾勒出一个AI作为“写作助手”、“生活顾问”和“决策副驾”的清晰画像。 1. 倾向于内容“加工”而非“从零生成” 与AI被视为“自动写手”的普遍观念相反,数据显示用户更多地将其用作内容优化工具。 • 写作任务的主导地位:在所有与职场相关的对话中,写作类任务占比高达四成。 • “加工”是核心需求:在这些写作任务中,有三分之二属于“加工”性质,包括改写、润色、翻译或优化逻辑,而非从零开始生成内容。 • 结论:用户并非将ChatGPT视为完全的替代者,而是作为一种增强工具,帮助他们更高效地打磨和完善已有的文本内容。 2. “决策支持”与“直接产出”的双重角色用户的意图在不同场景下表现出明显的差异,揭示了AI应用需扮演的双重角色。 • 总体意图分布:在所有对话中,“提问”(Asking)占比最高(51.6%),其次是“执行任务”(Doing)(超过三成),而“表达”(Expressing)最少(仅一成)。 • 工作场景的逆转:在工作相关场景中,“执行任务”的比例跃升至56%,其中写作是最主要的任务类型。 • 结论:在日常生活中,人们更多将AI视为获取信息和建议的“百科+顾问”;而在工作环境中,它则转变为一个高效的“生产力外包”工具。AI产品必须同时满足“决策支持”与“直接产出”的双重需求。 3. 用户画像的演变与多样化ChatGPT的用户群体正在迅速演变,其构成越来越贴近全球人口的平均分布,这对产品设计提出了新的挑战。 • 性别比例变化:早期用户以男性为主(约占八成),但到2025年中期,女性用户占比已达到52%,实现反超。 • 年龄结构:26岁以下的年轻用户贡献了接近半数的消息量,显示出对AI技术更强的接受能力。• 地域分布:用户增长更快的地区来自中低收入国家。 • 结论:用户画像的多样化意味着AI产品在功能和交互设计上需要满足更广泛、更多元的需求。 4. 工作场景中的“决策外挂”定位 通过将对话内容与美国劳工部ONET工作活动分类进行映射,研究发现AI在工作中的核心作用是增强人类的认知能力。 • 三大核心应用:使用最频繁的三类工作活动是“决策与问题求解”、“记录信息”和“创造性思考”。 • 增强而非取代:这一发现有力地反驳了“AI抢饭碗”的普遍焦虑。AI更像是一个为人类大脑装配的“决策外挂”,帮助用户更快、更全面地思考问题。 • 结论:取代人类并非AI应用的主线故事,增强人类的决策能力和创意实现才是更真实的图景。 5. 用户满意度的显著提升 研究通过自动化方法标注了“好互动”与“坏互动”,结果显示用户体验在持续改善。 • 正向互动增长迅速:数据显示,“好互动”的增长速度远快于“坏互动”。 • 满意度量化:到2025年中期,正向互动的数量已是负向互动的四倍。 • 结论:AI模型的进步并非仅停留在实验室的基准测试中,而是被用户在实际对话中直接感知和体验到,带来了更高的满意度。 对AI产品设计的启示 报告所揭示的用户行为模式,为AI应用厂商和开发者指明了产品设计的核心方向,即从技术展示转向满足真实、细分的场景需求。 1. 贴近真实需求,优化产品入口鉴于大多数写作任务是“加工”而非“生成”,产品的入口设计应反映这一现实。 • 超越空白输入框:与其在界面中心放置一个等待用户从零开始输入的空白框,不如优先提供粘贴、批注、差异对比等功能。 • 定位为“增强器”:产品应将自身定位为帮助用户补齐碎片化需求的“增强器”,而非试图全面替代专业软件。Stack Overflow的调查也佐证了这一点,开发者最常使用AI进行代码片段生成和错误解释,而非复杂的系统开发。 2. 提供分层体验,满足多样化用户随着用户群体的扩大,单一的产品体验已无法满足所有人的需求。 • 新手用户:需要结构化模板、语气选择和逐步引导等功能,以降低使用门槛。 • 熟练用户:则需要快捷命令、自定义工具链以及深度集成的API,以实现更高的效率和灵活性。• 挑战:如果应用不能提供分层的体验,将面临要么对新手过于复杂、要么对专家过于浅薄的两难局面。 3. 嵌入工作流程,建立信任机制报告指出,高频使用并不等同于高信任度。要让AI真正融入企业级应用,建立信任是关键。 • 可验证与可追溯:用户愿意依赖AI的前提是其结果能够被验证、追溯,并能融入组织现有的合规体系。 • 内置信任功能:AI应用在设计之初就应考虑数据来源标注、版本对比、结果审计等机制,而不是作为事后补丁。 4. 从“炫技”转向“打磨”,聚焦用户体验AI应用的发展已进入新阶段,重点不再是证明模型的能力,而是提升其实用性。 • 真实场景的价值:关键在于如何在真实场景下,让用户更快、更安全、更普遍地使用AI。 • 新赛点:真正的竞争赛点已经从模型本身,转向了用户体验、信任和普惠性。 结论:从技术竞赛到体验考验OpenAI的这份研究报告清晰地表明,至少在现阶段,用户更多地将AI视为一种“增强”工具,而非“替代”品。他们需要的是能够降低工作摩擦、提升效率的无缝体验,而不是令人惊叹但脱离实际的模型展示。这意味着整个行业正经历一场深刻的转变:**AI的发展已从一场单纯的技术竞赛,演变为一场关于设计、体验与信任的综合考验。**当全球数亿人每天都在与AI进行对话时,一种全新的人机交互范式正在形成。AI的未来走向,最终将由人们选择如何使用它来决定,而非技术本身。
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧