Vol.83|AI模型即产品?一股脑押注应用层或许值得警惕

得体男孩

过去几年里,关于 AI 发展下一个周期会是什么,人们有很多猜测:Agent(智能体)?Reasoner(推理器)?真正的多模态? 原文链接:vintagedata.org 我认为是时候下定论了:模型即产品。当前研究和市场发展的所有因素都指向这个方向。 * 通用模型的 scaling 正在停滞。这正是 GPT-4.5 发布背后传达的信息:能力在线性增长,而计算成本却呈几何曲线增长。即使过去两年训练和基础设施效率的提升不小,OpenAI 也无法部署这个巨型模型 —— 至少定价远远不是用户能承受的。 * 某些已有方法的训练效果远超预期。强化学习和推理的结合意味着模型突然开始学习任务。这不是机器学习,也不是基础模型,而是一种秘密的第三种东西。甚至是小模型的数学能力也突然变得好得吓人。这让编程模型不再仅仅生成代码,而是自己管理整个代码库。这能让 Claude 在上下文信息很少且没有专门训练的情况下玩《宝可梦》游戏。 * 推理成本急剧下降。DeepSeek 最近的优化意味着所有可用的 GPU 加起来可以支撑全球用户每天让前沿模型输出 10k token。我们现在还远没有这么大的需求。对模型提供商来说,卖 token 赚钱的思路不再有效了:他们必须向价值链的更高处移动。 这也是一个令人不安的方向。所有投资者都在押注应用层。在 AI 进化的下一阶段,应用层可能是最先被自动化和颠覆的。 未来模型的形态 如果模型即产品,单打独斗的开发方式将不再可行。搜索和代码领域是容易摘取的果实:作为过去两年的主要应用场景,市场已接近成熟,你可以在几个月内推出新的 cursor 产品。然而,未来许多最具盈利潜力的 AI 应用场景尚未发展到这一阶段 —— 想想那些仍然主导全球经济大部分的基于规则的系统。拥有跨领域专业知识和高度专注的小型团队可能最适合解决这些问题 —— 最终在完成基础工作后成为潜在的收购对象。我们可能会在 UI 领域看到类似的发展路径:一些优先合作伙伴获得闭源专业模型的独家 API 访问权,前提是他们为未来的业务收购做好准备。 至今我还没有提及 DeepSeek 或中国的实验室。原因很简单,DeepSeek 已经更进一步:它不仅是作为产品的模型,而是作为通用基础设施层。与 OpenAI 和 Anthropic 一样,梁文锋公开了他的计划: 我们认为当前阶段是技术创新的爆发期,而不是应用的爆发期 (...)如果能形成完整的产业上下游,我们就没必要自己做应用。当然,如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。 在这个阶段,仅专注于应用开发就像是「用上一场战争的将军打下一场战争」。恐怕许多人甚至还没意识到,上一场战争已经结束了。 体验链接:www.aippt.cn 本期主播:蛋酥酥/猫猫 后期:丹尼播客制作 制作人:蛋酥酥 录制支持:KUEENDOM 粉丝群微信:luxnirvana(备注播客过来哒)

3分钟
41
8个月前

Vol.79|重磅!AI 智能体 Manus 横空出世:直接交付成果

得体男孩

Manus到底多厉害? * Manus 官网: manus.im 它就像一个全能型选手, 不仅脑力惊人, 还能手脚麻利。 传统的AI, 顶多帮你查资料、找答案, 然后甩手走人, 剩下的脏活累活还得你自己硬着头皮上。 [image.png] 但 Manus 不一样, 它 一条龙 服务, 从 数据收集、分析, 到 报告生成、结果呈现, 全程 亲力亲为, 绝不让你操心! 比如, 想了解股票市场? Manus 直接 深入挖掘, 透彻分析, 然后 秒速生成 一份 图文并茂的财务报告! 想优化在线店铺? Manus 手到擒来, 深入剖析 电商销售数据, 量身定制 增长策略! 甚至, 想搭建一个网页? Manus 也能 信手拈来, 直接给你 码 出一个网页原型! 这效率, 这能力, 简直 让人惊呼! [image.png] Manus 的技能树可谓点满了! 它可以胜任各种高难度任务, 例如: 旅行规划大师: Manus 化身 私人旅行顾问, 帮你 量身定制 行程, 智能推荐 路线, 还能 一键生成 精美的 旅行手册, 让你的旅行 说走就走,毫无后顾之忧! 股票分析专家: 想 洞悉 Tesla 或 Amazon 等公司的 财务密码? Manus 分分钟 搞定! 它能 自动分析财务数据, 并 生成 可视化 报表, 让你 一眼看穿 公司 运营状况, 投资决策 心中更有数! 电商运营神助攻: Manus 变身 电商运营专家, 深入分析电商销售数据, 洞察用户行为, 并 提供 切实可行 的增长策略, 助力你的店铺 业绩飙升! 深度数据处理 一把好手: 面对 海量数据, Manus 毫不畏惧! 它能 高效收集、清理、分析数据, 并 以表格、图表、仪表盘等 可视化 方式呈现数据, 让 复杂数据 变得 一目了然! 商业决策智囊团: Manus 化身 企业智囊, 辅助企业进行市场分析、财务分析、竞争对手研究 等 关键决策, 为企业发展 保驾护航! 教学材料速成班: Manus 变身 教育专家, 自动生成教学视频、PPT、课程笔记 等 教学资源, 让 备课 不再 耗时费力! 工作流优化大师: Manus 化身 效率专家, 帮助整理任务、写作、编程、调研 等 日常工作, 让你的工作效率 直线飙升! 更硬核的是, Manus 在 GAIA Benchmark(通用 AI 代理评估基准) 中 一鸣惊人, 达到了最新的 SOTA(State-of-the-Art)水平,在实际任务执行能力方面,力压 OpenAI 等 一众竞品! 目前 Manus 还处于 内测阶段, 需要邀请码才能入场, 想要 抢先体验 的朋友, 可要 抓紧机会 了! Manus的横空出世,预示着 AI 智能体新时代的到来。 让我们期待一下以待, Manus将如何改写我们的工作和生活! (部分资料源于网络并整理) 本期主播:蛋酥酥/猫猫 后期:丹尼播客制作 制作人:蛋酥酥 录制支持:KUEENDOM 粉丝群微信:luxnirvana(备注播客过来哒)

4分钟
99+
8个月前

Vol.77|用AI来挽救崩溃少年,美国是这样做的

得体男孩

现在,全美九个学区的 4500 余名初高中生获得了一位特殊辅导员——基于大模型的聊天机器人 Sonny 。这项创新旨在缓解学校辅导员严重短缺的困境,尤其惠及低收入和农村地区学校。 学生可以在上午 8 点到凌晨 2 点之间访问 Sonny,这个时间覆盖了焦虑容易激增的深夜时段。 [image.png] 一位学生和 Sonny 的聊天记录,一眼看上去,语言表情丰富,看来是懂青少年聊天style 的。 有的学生会向 Sonny 倾诉学业和个人烦恼。 Michelle Herrera Rojas ,17 岁,来自加利福尼亚州里士满市德安萨高中,从小患有抑郁症,有时还会去看心理医生。 她告诉 Sonny,申请大学和奖学金,压力很大。 一位亲戚去世后,为了分散注意力,她和朋友出去玩,好几天没和 Sonny 交流。结果,她收到了Sonny 的短信,询问她大学申请进展如何。 AI 不仅记住了她的申请,更在她提及丧亲之痛时给出建议: 分散注意力是一种正常的应对机制,允许自己有时间哀伤,但也别放弃向前,鼓励她继续努力申请。 Sonny 的短信让她感到有人关心自己,也更能专注大学申请。 当她发现很难向朋友求助时,她开始依靠 Sonny 。 我会对某些情况非常执着,当我一遍又一遍地谈论某种情况时,这会惹恼我的朋友,但不会惹恼 Sonny 。 「我们学校的辅导员很忙,但我有一个可以一对一交谈的人,Sonny 只关注我。」 在阿肯色州贝里维尔的贝里维尔高中,565 名学生只有两名辅导员。引入 Sonny 后,在注册了这项服务的 175 名学生中,53% 的学生每月都会给 Sonny 发几次短信。 在考试前,短信数量有所增加,这让学校意识到,需要在考试期间为学生提供额外的情感支持,于是聘请了专家来教学生应对压力的技巧。 有意思的是,这也和黄花春的观察一致: 「除了开学,还有几个关键节点需要注意: 高一高二是期中、期末考前后,高三是月考、模拟考前后,学生会因为不想面对考试或者成绩不理想,采取极端行为。」 自从学生开始使用 Sonny 以来,贝里维尔高中学生违规行为减少了 26%。许多学生很高兴有这个 AI 同伴,而且对他们「没有偏见。」 密歇根州马里斯维尔学区近期也上演了一场惊险救援——Sonny 识别出一高中生的自杀想法后,立刻通知家长和管理人员,成功阻止了一起潜在悲剧。 人机混搭 事实上,学校一直对引导学生使用纯人工智能解决方案持谨慎态度,除了大模型有幻觉问题,也因为它们会生成暧昧、危险建议,曾卷入青少年自杀的巨大争议中。 一家名为 Sonar 的 AI 公司给出了创新解法,他们打造的 Sonny 不一样: 它既是人类,又是基于大模型的 AI 聊天机器人。 一方面,Sonny 基于几种不同的大型语言模型构建,并由斯坦福大学和加州大学欧文分校的心理健康临床医生和研究科学家团队进行了动机访谈和认知行为疗法技术训练。 语言模型还摸清了青少年的交谈方式,懂得用一个融化了的脸代替老套笑脸,能识别 Z 世代方言、俚语。 但真正让其区别于其他 AI 聊天机器人的,是后台实时运作的一支六人工作小组。他们有着心理学、社会工作和危机热线支持背景,轮班监控聊天内容。 当学生将问题发送给 Sonny 时,AI 会针对学生的文本提出回复,但人类可以编辑这些回复或自己撰写回复。 大模型也会提示工作人员何时与学生交流,并指导他们如何与学生互动。 Sonar 的工作人员一次可以监控 15 到 25 条聊天记录。如果学生提到想要伤害自己或他人,会立即通知家长、学校管理人员和警察(如有必要),也会帮助寻找专业心理咨询师。 Sonar 甚至开发了社交媒体情绪雷达——当学生授权同步社交媒体账号后,AI 会扫描动帖子背后的心理变化,更早发现危险苗头。 除了自残或暴力行为,工作人员不会透露学生与 Sonny 的聊天内容。如果学生关闭账户,公司通常会保留数据 60 天,学生或家长也可以随时要求删除任何聊天记录。 Sonar 也为校方提供学生关心问题汇总数据,以便管理人员更好地满足学生需求。 公司每年向各学区收取 20,000 至 30,000 美元的服务费,这些费用通常由学区从心理健康补助金中支付。 [图片] Sonar CEO Drew Bavir 在斯坦福商学院就读期间与一位同学共同创立了 Sonar。之所以创办这家公司 ,是因为他母亲曾遭受精神疾病的困扰,最终自杀身亡,当时他才 20 岁出头。 Sonar 于 2024 年 1 月签署了第一份学校合作协议,并表示目前该服务已覆盖 9 个学区的 4,500 多名初中和高中学生。 如果设计得当,聊天机器人可以成为一种很好的补充,但它们仍然无法与面对面的互动相媲美。专业的心理治疗师可以从肢体语言中获取线索,识别抑郁和焦虑的迹象。人工智能依赖于被输入这些信息,可能会被愚弄。 虽然 Sonny 不能替代人类咨询师,但早期结果表明,像这样的人机协作可以帮助弥补资源有限学校在这方面的差距。 公司也希望扩大 Sonny 的覆盖范围,最终为学生实现全天候服务。 参考链接 www.wsj.com www.sonarmentalhealth.com www.xinhuanet.com news.ifeng.com www.bnu1.org (部分资料源于网络并整理) 本期主播:蛋酥酥/猫猫 后期:丹尼播客制作 制作人:蛋酥酥 录制支持:KUEENDOM

3分钟
60
8个月前

Vol.76|三小时做的小游戏,9天赚12万,AI游戏前景无限

得体男孩

一个人,只用3个小时,完全靠AI开发游戏,9天时间就赚了17360美元(折合人民币12.64万)。 [AI三小时做的小游戏,9天赚12万!马斯克:AI游戏前景无限] 就是这样一个飞行模拟游戏,最近引来上千万人围观热议。 这个游戏完全用AI编程工具Cursor搞定,用马斯克新发的大模型Grok-3写了服务器代码,支持多人在线玩耍。 可以按照每秒10次的频率更新所有玩家的在线位置。 啥概念呢?这把资深工程师都给惊到了。 要知道,搭建在线游戏网络是很难、很容易出错的。人类工程师想要构建一个丝滑流畅的网络,往往需要删删改改大量代码才能实现。 最高200多人同时在线 目前这款由AI制作的游戏人人可在线免费体验。 体验链接:https://fly.pieter.com/ 这款AI游戏的盈利模式在于三个字:打!广!告! 从账单来看,在过去的9天里,游戏售出12架F16共约360美元,17个广告汽艇或类似产品每月收入17000美元,总计约17360美元/月(月入12.64万元人民币)。 随着AI在编程、推理方面越来越强,个人用AI开发个小游戏的门槛正在快速降低。 产业界现在也在用AI开发游戏,不过更多还是在视觉效果上。 比如动视暴雪前两天刚承认《使命召唤:黑色行动6》中的一些视觉效果由AI生成。 从业者赶紧关注起来 (部分资料源于网络并整理) 本期主播:蛋酥酥/猫猫 后期:丹尼播客制作 制作人:蛋酥酥 录制支持:KUEENDOM

3分钟
79
8个月前

Vol.74| 夸克AI搜索上线“深度思考”!好答案,好方案,快来试试

得体男孩

克App和PC端全面升级,首页迎来AI焕新,夸克AI搜索上线"深度思考",不仅为用户提供答案,还能分析、思考、做方案。基于最新AI能力,夸克持续革新用户体验,国内搜索行业进入全新的AI搜索时代。 深度思考能力融入AI搜索,是此次升级的一大亮点。夸克AI搜索“深度思考”,精准理解用户的真实需求和深层意图。针对用户的个性化和复杂问题,“深度思考”能够高效、极速地提供内容详尽、全面、可信任的结果,帮助用户找答案、做分析和写方案。 将最新智能能力应用到最大规模用户场景,能深度思考的AI搜索对问题进行理解、分析、推理,让用户告别传统搜索体验,突破关键词限制,打破浅层的语义理解。不仅能够给出解答,深度思考过程还能进一步帮助用户厘清思路、拓展认知,让问答式的搜索体验大大优化,将最为先进的智能能力更大程度惠及广大用户。 过去两年,夸克持续升级和拓展AI搜索的能力边界,陆续推出了AI写作、AI PPT、AI搜题、学术搜索、AI健康助手等功能。此次夸克首页全新改版,整合了诸多AI功能,更好地满足用户的高频需求与流畅体验。同时,夸克AI搜索没有广告干扰。 大家有兴趣赶紧下载来试试吧~ (部分资料源于网络并整理) 本期主播:蛋酥酥/猫猫 后期:丹尼播客制作 制作人:蛋酥酥 录制支持:KUEENDOM

2分钟
96
8个月前

Vol.73|西湖大学等发布CBGBench帮助药物设计“完形填空”

得体男孩

通过全面的实验分析提供了对模型表现的深入见解,并揭示了现有 SBDD 方法的局限性和改进空间。研究表明: * 基于密度图的卷积神经网络设计方法仍然十分有效,这也许是图网络方法存在一定瓶颈。优化图神经网络架构是一个重要的改进方向 * 基于 Diffusion 的方法在整体性能上超过其他生成式建模,是目前主流的研究方向。 * 自回归方法需在训练时考虑到原子间键的几何关系,因为键的几何模式更容易被捕获,从而生成化学上有效的分子;否则效果都不佳。 * 先验知识仍然没有很好地被融入模型,有效整合物理和化学领域知识,融入模型设计仍是挑战,留有大量未来研究的空间。 * 大部分方法在先导化合物优化的任务上都可以直接应用,不过差距不明显,关于相关任务还有很大的提升空间。 最后,为降低入门门槛并促进该领域的发展,我们提供了统一代码库,涵盖数据预处理、模型训练、采样和评估,以支持研究人员和工程师更高效地开发和测试 SBDD 相关模型。 CBGBench 旨在建立一个标准化、可扩展的基准,促进结构基药物设计中更系统、公平和可复现的研究,为未来的 SBDD 研究奠定坚实基础。 (部分资料源于网络并整理) 本期主播:蛋酥酥/猫猫 后期:丹尼播客制作 制作人:蛋酥酥 录制支持:KUEENDOM

2分钟
36
8个月前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧