通往超级个体之路 - DeepResearch：当 AI 学会慢思考 - EarsOnMe

主播...

简介...

通往超级个体之路PadNotes | Episode 18 | DeepResearch：当 AI 学会慢思考
大家好，欢迎来到《通往超级个体之路》第 18 期！今天我想跟大家分享一些关于 AI 的最新观察和思考。
我一直把自己看作是AI 观察家，虽然我没有直接训练最领先的 AI 模型的能力，但我喜欢研究它们的行为、阅读它们的论文，并尝试理解其背后的逻辑。这本身就是一件很有趣的事情。
最近，我发现了一个很有意思的现象，也许别人已经总结过了，但这确实是我自己观察到的规律——大模型正在变得越来越慢，也越来越会思考。
01:06 大模型正在变“慢”——从直觉到深度思考
01:18 直觉式思考（GPT-3 & GPT-4 早期阶段）
• 早期的 GPT-3 和 GPT-4 的回答非常快，你一问，它立刻给出答案，就像人类的直觉思考。
• 这个阶段的大模型主要依赖预训练（pre-training），类似于学生学习了小学、初中、高中的知识，已经具备了基本的知识储备。
• 但这种直觉式回答的一个问题是幻觉较多，准确率大约在 90% 左右。
02:33 慢思考的出现（GPT-O1, DeepSeek R1 思维链阶段）
• 现阶段的 AI（如 DeepSeek R1）已经学会了慢思考。
• 你会发现，它在回答前会先拆解问题，并进行一步步推理，而不是直接给出直觉性的答案。
• 这个阶段的 AI 比较像人类的系统二思维（slow thinking），它更擅长拆解任务、理性推理，并能够主动反思自己的推理过程。
03:43 DeepSeek R1 的 AHA Moment：AI 居然学会了反思！
• 这里有个让我震撼的例子，DeepSeek 在解数学题时，突然停下来，说**“Wait, wait, wait”**（等一下！），然后回头重新检查自己的推理。
• 这个过程意味着 AI 不仅在前进，也在回溯自己的思考过程，就像人类在做复杂决策时会不断回顾和检查。
04:45 DeepResearch：AI 的“研发式思考”
2 月 2 日，OpenAI 发布了DeepResearch，一个基于 GPT-4o3（尚未发布）模型的新功能。它标志着 AI 从慢思考进化到了研发式思考。
05:02 DeepResearch 的核心能力
• 它可以自主进行“研究-发现-再研究-再发现”的循环过程。
• 这个过程类似于人类做科研：
1. 先查找 40~50 个信息源。
2. 进行初步推理。
3. 如果不确定，再进一步查找信息、验证观点。
4. 这个过程持续进行，直到它的计算资源到达上限，或者它认为自己已经找到最优答案。
• 这一阶段的 AI 思考时间从过去的 10-30 秒，延长到 5-30 分钟！
06:22 DeepResearch 实测：AI 学会了写论文？
• 我做了一个实验：
• 我朋友（投资圈的人）在朋友圈问了一个问题：
“量子计算机会不会引发人工智能的重大突破？”
• 我先自己思考了一下，但不确定自己的答案是否靠谱。
• 于是，我把这个问题交给 DeepResearch，结果它的回答惊艳到了我：
• 它查阅了 16 个高质量信息源（包括政府网站、大学论文、核心期刊）。
• 每个句号前都标注了信息来源，确保每一句话都有学术支撑。
• 它的回答结构清晰、逻辑严密，几乎等同于一篇学术论文！
这意味着，AI 正在变成一个真正的“科研助手”，甚至比人类更擅长跨学科研究。
原提问——目前，量子计算受限于要超导，但是超导目前又受限于超低温等，只能在实验室环境，这个说法对吗？
deepresearch回答：
···中间部分截去
07:16 人类的“最后一次考试”：AI 真的比人强了吗？
为了衡量 AI 的真正能力，最近有人提出了一个新的测试，被称为“人类的最后一次考试”。
• 考试题目难度极高，涵盖历史、哲学、数学、代码等领域的交叉问题。
• 例如：
• 让 AI 翻译一块古罗马铭文，并用另一种古语言（帕米拉文）重写。
• 目前普通 AI 远远做不到，但 DeepResearch 已经能解决部分这类问题！
• 最新成绩：
• DeepResearch 最高得分 25 分（满分 100），排名第一。
• DeepSeek 也在前五名，得分 9-10 分。
这表明：现阶段 AI 已经超越普通人的认知能力，但还没有真正达到“通用人工智能（AGI）”的水平。
10:46 AI 研究者的主场：DeepResearch 背后的华人科学家
这次 DeepResearch 的发布，背后其实隐藏着一个重要现象：
• 该项目的 Leader 之一，是一名华人科学家——孙之清。
• 他是浙江舟山人，1997 年生，现年不到 30 岁，卡内基梅隆大学博士在读。
• 他的背景：
• 舟山中学 → 北京大学 → 卡内基梅隆大学
• 本科期间已发表顶级论文，博士阶段便成为 OpenAI 重要的技术负责人。
更令人惊讶的是：
• DeepResearch 核心开发团队 21 人，其中至少 11 人是华人或华裔！
• 这意味着，全球 AI 的核心竞争者，已经逐渐变成了“中国 AI 团队 vs. 华裔美国 AI 团队”，双方正在进行一场跨国竞赛。
14:46 DeepResearch 的商业模式与局限性
虽然 DeepResearch 很强，但它并非没有问题：
1. 价格昂贵
• PRO 版用户才能使用，每月 200 美金，还只能问 100 个问题！
• 仅限美国、英国、欧盟、瑞士用户，中国、日本等地无法使用。
2. 触发率极低
• 实测发现，只有 10% 的问题能真正激活 DeepResearch，其余 90% 仍然是普通 GPT-4 级别回答。
• 这让用户感到被“降智”，付费却无法使用完整功能。
我预测：国内 DeepSeek、智谱等团队，应该会在 3 个月内推出类似产品，填补市场空缺。
18:35 结论：AI 的慢思考时代来了
总结一下今天的观察：
• AI 从直觉式思考 → 慢思考 → 研发式思考
• DeepResearch 代表了一种新模式：AI 变成真正的科研助手
• 人才竞争进入“中美 AI 团队”之争，中国科学家正成为 AI 领域的核心力量
未来，我们很可能会迎来“AI 论文时代”——所有 AI 生成的报告，都附带完整的参考文献，确保学术可信度。这会彻底改变科研、教育、咨询等多个行业。
21:46 互动环节
今天的内容就到这里，感谢大家收听！如果你对 AI 的未来发展或 DeepResearch 这种新型 AI 研究方式感兴趣，欢迎留言讨论。
你觉得 AI 还能学会哪些“人类式思考”？
DeepResearch 能成为未来科研标配吗？
期待你的观点，我们下期见！🚀

评价...