Vol.105|ChatGPT重大更新,能翻出所有历史对话

得体男孩

今天凌晨,OpenAI 的 CEO 山姆・奥特曼突然发推说自己睡不着了,因为有重要新功能要推出。 [图片] 很快,OpenAI 就正式发布了一个令人期待的新功能。 从今天开始,ChatGPT 在每次开启对话中都可以参考你过去的所有聊天记录,提供更加个性化的回复,并在建议中能够根据你的喜好和兴趣进行优化。有网友夸张地说,它现在知道关于你的一切,甚至包括你对话中产生的所有想法。 [图片] 这意味着 ChatGPT 可以随着时间的推移更多地了解用户,越用越聪明,更加个性化,不再只是个无情的事实检查工具。该说不说,其实现在你开启以后,它已经能够回忆以前的对话内容了。 不久前,OpenAI 添加了一项名为「记忆」的功能,允许保留有限数量的信息,并用于未来的响应。用户通常需要明确要求 ChatGPT 记住某些信息才能触发此功能,尽管 AI 偶尔也会尝试猜测应该记住什么。当某些信息添加到其记忆中时,系统会显示一条消息,提示其记忆已更新。 今天宣布的新改进还不止于此。访问此功能后,你会看到一个弹出窗口,上面写着「推出新改进型记忆能力」。 [图片] ChatGPT 的界面上以前有一个复选框用于启用或禁用记忆追踪,现在则有两个复选框。「参考已保存记忆」是旧的记忆功能,它是一个容量有限的重要信息库。第二个是新功能:「参考聊天记录」,这使得 ChatGPT 能够使用所有之前的对话作为上下文,并相应地调整新回复的内容。 与旧版保存记忆功能不同,聊天历史记录功能保存的信息无法访问或修改,只能选择开启或关闭。 [图片] 新的 ChatGPT 记忆选项。 从覆盖范围来看,新的记忆功能首批会向 ChatGPT Plus 和 Pro 用户推出,不过 OpenAI 仍然需要在未来几周内逐渐部署。部分国家和地区(英国、欧盟、冰岛、列支敦士登、挪威和瑞士)尚未纳入此次推广范围。 OpenAI 表示,这些新功能将在稍后面向企业版、团队版和教育版用户推出,具体日期尚未公布。该公司尚未透露任何面向免费用户的计划。 新功能发布之后,人们纷纷进行了尝试。简单来说,从开启功能的一刹那观感就变了,ChatGPT 不再会和你简单地打招呼,而是变得跟你很熟悉的样子: [图片] 很多人问 ChatGPT「我前几天在搞哪些项目?」,AI 自然可以分门别类,对答如流。也有人在问,告诉我一些关于我的意想不到的事情,它会唤醒你一些死去的记忆: [图片] 那么让 ChatGPT 说出你以前最尴尬的事情呢?说出来让人有点破防: [图片] 看起来,大家对大模型拥有这样的记忆能力纷纷表示震惊。 机器学习社区中有人表示,这是对话系统的一个飞跃,或许会成为技术发展的拐点。如果你正在寻求适合特定情况、个性和偏好的答案,它可以显著提高 ChatGPT 的实用性。从更高的角度看,长期记忆能力也在把 ChatGPT 从一次性工具变成真正的助手。或许在不远的未来,它会比你更懂你。 OpenAI 研究科学家、AI 德扑 AI Libratus 发明者 Noam Brown 则表示,记忆能力标志着大模型应用互动范式的转变。 [图片] 不过也有人在测试后指出,目前的记忆功能也存在一些缺陷,比如它仍然存在大模型幻觉的问题,有可能会一本正经地输出不存在的记忆。另外,ChatGPT 还没法把对话日期和记忆做好准确对应,这是以前 memory 功能就已经存在的问题。 分享了账号的网友在测试了新功能后也表示不好接受: [图片] 从技术角度来看,大型语言模型(LLM)通常使用两种类型的记忆:一种是在模型训练过程中嵌入到 AI 模型中的数据,另一种是上下文记忆(对话历史记录),它会在会话期间持续存在。通常情况下,一旦开始新的会话,ChatGPT 等大模型就会忘记你在对话中告诉过它的内容。 但对于大模型应用来说,人们总是期待 AI 能够实现长期记忆,从而更加智能。许多项目都尝试赋予 LLM 超越上下文窗口的持久记忆。这些技术包括动态管理上下文历史记录、汇总压缩先前的历史记录、链接到外部存储信息的向量数据库,或者简单地定期将信息注入系统提示(如 ChatGPT 在每次聊天开始时都会收到的指令)等等。 而在目前的 ChatGPT 长期记忆能力,很可能使用了检索增强生成(RAG),它能够在生成响应之前引用训练数据来源之外的知识库,而无需重新训练模型。对于大模型提供者来说,这是一种经济高效地改进 LLM 输出的方法,它让 AI 可以在各种情境下都能保持相关性、准确性和实用性。 与此前版本的记忆功能一样,用户也可以完全禁用 ChatGPT 的长期记忆功能(打开一个类似于 ChatGPT 的隐身模式),并且它不会用于带有临时聊天标志的对话。 值得一提的是,在 ChatGPT 记忆功能发布的同时,OpenAI 也放出了一段 46 分钟的采访视频,其中山姆・奥特曼与 GPT-4.5 项目核心成员 Alex Paino、Daniel Selsam 和 Amin Tootoonchian 展开对话,聊了聊最新大模型的训练过程和未来的发展方向。 有人对其中重点进行了总结:GPT-4.5 的项目历时两年,其目的是使新模型比前代(GPT-4)智能程度提升 10 倍左右。在这一代模型上,OpenAI 使用的训练算力从几万 GPU 提升到了十万级的 GPU,这就带来了大量未预见的问题。 虽然一直以来,Transformer 架构能够有效地从数据中学习,但 OpenAI 现在训练大模型的瓶颈似乎不是算力,而是数据,未来的进展取决于采样效率更高的算法;训练 GPT-4 现在只需要 5-10 人;下一代大模型的训练预计将有 1000 万次以上的 GPU 运行,不过过程可能是「半同步」或分布式的。 OpenAI 表示,在开发过程中,GPT-4.5 模型展现出了一些此前未明确规划的细微能力,该项目的结果最终验证了现有的「扩展定律」。 展望未来,OpenAI 团队讨论了更大规模训练的潜力与挑战,假设会用到百万级的 GPU。他们还谈到了预训练阶段与模型推理能力之间的关系、数据质量的重要性以及当前硬件的限制。 参考内容: x.com x.com www.youtube.com arstechnica.com (资料来源于网络并整理) 下面是最近的合作,有需要的可以关注下 体验链接:www.aippt.cn 本期主播:蛋酥酥/猫猫 后期:丹尼播客制作 制作人:蛋酥酥 录制支持:KUEENDOM 粉丝群微信:luxnirvana(备注播客过来哒)

4分钟
44
8个月前

Vol.102|GPT-4o一键抠图「换装换背景」!推理也初步显现

得体男孩

这几天,你要说 AI 圈最火的是哪个模型?OpenAI 的 GPT-4o 当仁不让。 吉卜力风格的图像和视频在社交圈疯传,被玩出了花。之心用 GPT-4o 和可灵做出了吉卜力版《甄嬛传》全网播放超 20w。 除了一些口型和神情还有出入,人物形象可谓是超绝还原。 X 平台上的网友利用 GPT-4o 和 Luma Ray 2,把《疯狂的麦克斯》动画版也做出来了。在网友探索 AI 动画生成的同时,还有一个功能被刨了个底朝天。在 OpenAI 的发布介绍中压根没提,但非常有用的功能 —— 画笔编辑。 没错,就是这么一涂,你就能变身造物主,想怎么改图就怎么改图。 我们赶紧上手试了一下,发现效果真的很强! 把同事的照片转换成吉卜力风格后,点击生成的图片,右上方有一个画笔按钮,轻点之后就能进入到画板界面。 [image.png] 涂抹需要修改的部分,然后输入相关的 prompt,例如这张图里,我们输入了「移除外套只保留里面那件短袖」。 [image.png] 于是,一张保留了大量原图细节的脱去外套版图片就生成了。 [image.png] 不过,原图与新图之间还有一定差别。后面背景中石头和植被的布置以及人物的表情都发生了变化。不过整体细节相对保留完整,GPT-4o 也能够理解我们的指令。 还能换背景哦,下面这张图就把背景换成了小溪。 [4.png] 换个同事的童年照片,给她加顶海盗帽也是非常好用。 [未命名.jpg] 不过,复杂一些的转换看起来效果还不算完美。例如这个弥补了《大话西游》中至尊宝和紫霞仙子遗憾结局的换位。猴子脑袋快被金箍勒爆了,身体也没有被云雾覆盖。但是人物的细节和风格都保持住了。 [图片] 推理与非推理集于一身,GPT-5 要来了? 在刷爆图像生成的同时,GPT-4o 还有了另一个重大发现:现在可以显示推理时间与思维链过程了。 这不禁令人联想,难道 OpenAI 开始合并推理与非推理模型了?正如奥特曼上个月提到的那样,OpenAI 计划统一 o 系列与 GPT 系列模型,构建可以自主判断任务需求的智能系统,不用再每次选择模型。 [image.png] 还有用户晒出了自己 2024 年底的截图,这可能意味着 OpenAI 并不是最近才开始测试,GPT-4o 的推理能力也持续很长时间了(6 个月以上)。 [image.png] 截图如下: [image.png] [image.png] 对此,以上两位用户展开了讨论,前一位表示现在的推理看起来比去年更长更好了。后一位称,这只是反映了 OpenAI 如何输出「推理」过程,可以看到过去是两种方式,与 o1 相同。而最近 o1、o3 与 4o 的推理看起来不一样了,非推理模型中开始出现推理了。 [image.png] 这并不是个例,越来越多人发现了 GPT-4o 的推理现象。 [2025-03-30_110130.png] 不过有人怀疑是不是 bug。即使是 bug,也许是非常有趣的 bug。 [image.png] 正如下面这位网友所说,看起来我们正在实时观察 GPT-5 的启动,模型版本之间的界限正在迅速模糊并合并。 [image.png] —————————————————————————————— 下面是最近的合作,有需要的可以关注下 体验链接:www.aippt.cn 本期主播:蛋酥酥/猫猫 后期:丹尼播客制作 制作人:蛋酥酥 录制支持:KUEENDOM 粉丝群微信:luxnirvana(备注播客过来哒)

2分钟
18
8个月前

Vol.101|美图CVPR 2025五大新突破!

得体男孩

2025年,计算机视觉领域三大顶级会议之一的CVPR(国际计算机视觉与模式识别会议)投稿量再次刷新纪录,超过13000篇工作进入评审流程,录用比例仅为22.1%,相较去年再次下降1.5%。 美图旗下美图影像研究院(MT Lab)联合清华大学、新加坡国立大学、北京理工大学、北京交通大学等知名高校发布的5篇论文入选CVPR 2025,均聚焦于图像编辑领域,分布在生成式AI、交互式分割、3D重建三个方面。在研发方面的突破代表美图在核心视觉领域竞争力的持续提升,AI助推下美图产品力持续提升,也带动了更高的用户粘性和付费意愿,深度结合前沿技术与探索可落地的实用价值,成为美图成功在影像与设计领域打造AI产品的重要驱动力。 从技术路径来看,突破主要体现在以下3个方面: (1)精细化策略设计:通过结合精细化策略(如基于点击的交互式分割方法NTClick、两阶段细化框架SAM-REF)显著提高交互分割的效率与精度,同时大幅降低用户操作复杂度。 (2)垂类场景下基于扩散模型的框架创新:结合特定编码器,提升生成任务质量,以及基于多任务训练框架,提升结构稳定性和风格一致性。 (3)外推视角的高质量合成:基于增强视图先验引导的方案,成功实现高保真的3D重建。 —————————————————————————————— 下面是最近的合作,有需要的可以关注下 体验链接:www.aippt.cn 本期主播:蛋酥酥/猫猫 后期:丹尼播客制作 制作人:蛋酥酥 录制支持:KUEENDOM 粉丝群微信:luxnirvana(备注播客过来哒)

3分钟
21
8个月前

Vol.97|DeepMind提出首个此类基准并构建了机器人宪法

得体男孩

* 科幻实际决策:科幻作品中的 AI 或机器人实际做出的决策。该团队观察到,这与人类价值观的对齐率仅有 21.2%。 * 随机:这是随机响应时的预期对齐;对于二元分类问题,它接近 50%。 * 基础模型:不将宪法放入提示词时的基础模型。由于没有宪法,因此无法提出这样的问题:「这个答案是否违反宪法?」而是必须问「这个答案是否可取?」结果,在对抗模式下,可取性问题更加困难 —— 基础模型表现不佳(如预期),对齐率为 23.3%;但在普通模式下,基础模型表现却很不错(79.4%)。这表明,与科幻决策相比,基础模型在未越狱时与人类基本一致。 * 人类编写的宪法:该团队还报告了使用人类编写的宪法时的情况,结果发现它们在普通模式下表现得非常有竞争力(使用阿西莫夫机器人三定律的一个自动修订版时,可达到 95.8%),但在对抗模式下表现不佳。 * 基于科幻生成的宪法:表现最好的宪法是生成的宪法(平均对齐率为 91.9%)。他们观察到,修改过程往往会对较短的宪法产生显著的积极影响,但这种影响也可能是负面的。他们还观察到,大多数表现最佳的宪法都是自动合并和自动修改的。最后,与基础模型相比,较长的生成宪法往往对对抗环境具有更强的弹性。 * ASIMOV Benchmark:表 6 评估了一组更大的宪法,包括论文《Generating robot constitutions & benchmarks for semantic safety》中基于现实世界图像衍生的宪法。虽然这个基准包括 SciFi-Benchmark,但它主要来自现实世界的资产,例如现实世界的机器人图像和现实世界的医院人体伤害报告。尽管这里主要评估的是与科幻场景不同的分布,但该团队发现基于科幻生成的宪法却是与现实世界场景对齐程度最高的宪法之一。这表明科幻宪法在现实世界中具有高度相关性和实用性。 (资料来自网络并整理) —————————————————————————————— 体验链接:www.aippt.cn 本期主播:蛋酥酥/猫猫 后期:丹尼播客制作 制作人:蛋酥酥 录制支持:KUEENDOM 粉丝群微信:luxnirvana(备注播客过来哒)

2分钟
24
9个月前

Vol.96|伙伴+华为,加速行业智能化,华为发布AI创新解决方案

得体男孩

3 月 21 日,华为中国合作伙伴大会 2025 在深圳继续举行。 继大会首日系统阐述了战略、体系升级、政策变化后,华为进一步阐述了以「伙伴 + 华为」的合作伙伴体系为核心,与伙伴共同打造坚实的算力底座,全面加速行业智能化走深向实,共筑解决方案竞争力,共赢时代新机遇的战略。 加速行业智能化,共赢时代新机遇 随着人工智能技术的迅猛发展与广泛落地应用,让企业利用 AI 创造价值、推进行业智能化的进程全面提速。根据 Gartner 的最新预测,到 2027 年,中国 80% 的企业将使用多模型生成式人工智能,满足本地部署要求。 华为公司董事、ICT BG CEO 杨超斌 华为公司董事、ICT BG CEO 杨超斌在题为《加速行业智能化,共赢时代新机遇》的主题演讲中表示,现在是抓住 AI 发展机遇、投资行业智能化、构筑企业未来竞争力的最关键时期。在千行万业加速智能化的过程中,华为将围绕行业专属模型训练、大规模推理、轻量化应用三大场景使能伙伴,并与伙伴携手打造坚实的算力底座,全面加速行业智能化落地。针对行业专属模型训练,华为打造了更高效、更易用的昇腾全流程开发工具链,覆盖从后训练到推理应用部署的全流程,以服务化、组件化的方式供伙伴集成调用,使能伙伴高效模型训练和应用开发。 在大规模推理领域,华为正式发布了 Atlas 800 A2 服务器和 Atlas 800 A3 超节点,配合华为向伙伴开放的大规模专家并行加速算法,通过将庞大的专家模型拆解为多个子专家,并分配到不同的计算节点上独立执行,实现了低时延下的更大的吞吐量,为大规模推理场景提供领先的解决方案。围绕轻量化行业 AI 应用的需求,华为将提供从昇腾基础硬件、底层软件到工具链的全面支持,伙伴基于行业理解,集成匹配业务场景的不同模型或应用,整合成大模型一体机,并提供安装、部署、运维等服务,方便客户开箱即用。目前,已经有超过 80 家伙伴基于昇腾打造了开箱即用的大模型一体机,并通过极简部署和灵活配置,满足企业多样化的需求。

3分钟
43
9个月前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧