关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为, AI助理正在嵌入所有移动终端,工作型AI助理对任务执行质量要求较高,生活型AI助理对响应时间要求很高,第一代人机协同生产力,从人类学习熟练使用AI助手开始。 全球AI要闻,谷歌DeepMind CEO预测,2年内出现“通用AI助理”。 日前,谷歌DeepMind CEO Demis Hassabis在2024英国未来会议指出,Chatbot在总结演讲、文件处理等方面非常有用,还是有点像玩具。 谷歌大模型Gemini从一开始就在构建原生多模态,这意味着语言、音频、视频、图像和编码等不同的模态融合。他指出,两三年内,我们将开始看到 “通用助理”,AI助理们在不同设备上陪伴用户使用,无缝帮助我们的日常生活,并带来惊人的生产力变革。 亮点1,下一阶段模型技术的重点是引入游戏相关技术,比如AlphaGo,给模型设定一个目标、提出新策略、制定新计划,甚至可能发明一些新东西,这将使我们拥有的技术类型再次向前实现一大飞跃。 亮点2,全新开源技术即将问世,这些模型版本可供任何人免费使用。Demis Hassabis认为AI模型服务涌现,政府或公司都能采用现有最优秀的模型,用自己的数据进一步微调。 亮点3,在下一个十年中,我们将在能源、材料科学、数学、气候等许多科学领域看到AI的突破。其中,真正有趣的是AI数字助理,有时人们觉得它可以取代人类劳动力,但我们其实应把它看作只是一个工作同事。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,在科技领域,低成本是全民需求的“最佳伴侣”,大模型与算力都在尺度定律的高速公路上飞驰,AI公共基础设施在工程化领域不断遇到新问题、找出新解法,全社会的生成式智能、具身智能将有望在未来3年享受到更低成本的算力、数据公共服务。 全球AI要闻,美国红杉认为,2025年才是AI数据中心大年。 7月8日,红杉资本合伙人戴维·卡恩分享对数据中心建设热潮的五大预测。他指出,2025年将是“数据中心之年”,我们正处于从炒作周期向工业驱动建设周期过渡的风口浪尖。 亮点1,人工智能将催化新能源转型。一些超大规模企业会发现,他们不够灵活,新的工业AI参与者将填补这一空白。新AI数据中心将在实体经济带动钢铁、能源、运输和建筑等经济发展。 亮点2,未来6个月开始,由于液体冷却、集群规模和电源接入问题,在2025年数据中心建设将出现大量延迟上线,技术问题也比比皆是,下一代英伟达芯片需要液体冷却,而目前液体冷却供应链出现短缺。锂离子电池已成为新数据中心建设的主要材料。 亮点3,超大规模数据中心运营商将有市场格局之分,Equinix、Digital Realty、CyrusOne等市场参与者正经历“冲击”,当新数据中心容量上线时,AWS、Azure等提供训练推理成本将大幅下降,这对初创公司有利。但是否有足够需求来满足,目前还不知道。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,训练数据是机器人智力的源头,包括复杂环境中完成任务的行动类、规划类训练数据到达“临界值”后,闭源或开源的机器人基础模型会出现,然后快速推动全球机器人产业创新发展,我国国产的机器人基础模型架构亟待科研提速。 全球AI要闻,AI机器人公司融资3亿美元,数据量比同行大千倍。 近日,机器人公司Skild AI宣布A轮融资3亿美元,投资者包括杰夫·贝佐斯、软银、红杉资本等,估值达15亿美元。公司成立不到1年,由卡内基梅隆大学教授Deepak Pathak和Abhinav Gupta 创立,构建首个可扩展的机器人基础模型,能适应不同的硬件和任务,在模型设计上具有鲁棒性。正在突破机器人数据壁垒,Skild AI训练模型的数据量是竞争对手模型的千倍以上。还披露了Skild AI 移动操控平台,由 Skild Brain 提供动力,在这个平台上“可以开发用于机器人的高级 AI 算法和应用程序”,他们想要“使机器人操作像调用普通 API 一样简单”。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,硅谷一向对科技巨头监管严格,同时谷歌很可能发现了即将到来的云计算市场安全风险与商业机遇,相对于737亿美元的年度净利润,拿出1/3来投资新一代云计算安全能力,也掀起了AI云安全投资并购浪潮。 全球AI要闻,谷歌史上最大金额收购案来了! 据《华尔街日报》报道,谷歌母公司Alphabet将以近230亿美元的价格收购云计算网络安全初创公司Wiz,双方正在进行深入谈判,如果谈判成功,这将成为谷歌有史以来规模最大的收购。Wiz今年的早些时候完成了10亿美元的融资,估值达到120亿美元,在2023年经常性收入达3.5亿美元。谷歌收购Wiz将显著增强谷歌云服务的安全能力,提升云安全市场核心竞争力,吸引更多企业级客户。目前谷歌正在等待司法部反垄断诉讼的判决。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,当人类面对大模型的幻觉等问题时,最有效的方法是发明一种新的AI监督技术来消除幻觉,以模型治理模型,以AI改进AI。人类的可解释性来自于因果性,所以大模型的问题应追溯到数据源头。 全球AI要闻,OpenAI安全主管找到新方法,克服大模型幻觉。 7月13日,OpenAI安全系统团队负责人Lilian Weng在博客最新分享了在理解、检测和克服大语言模型幻觉方面的诸多研究成果,她参与了GPT-4的预训练、强化学习、对齐等工作。模型输出应该以预训练数据集为基础,为了避免这类外源性幻觉,大语言模型应遵循一定训练原则,实事求是,不知时要承认不知。 亮点1,幻觉检测的创新方法,引入FactualityPrompt基准数据集,通过检索增强式评估和基于采样的检测来量化模型幻觉。搜索增强式事实性评估器表现优于人类标注者,同时成本还低20倍,与人类的一致率为72%,而当与人类不一致时,胜过人类的胜率为76%。 亮点2,动作链的新框架涌现。2023年提出的Chain-of-Verification方法,通过规划和执行验证来减少幻觉,为模型的自我校验提供了新思路。实测大约7-10%的问题虽复述正确但未能得到正确答案,而大约12%的问题虽复述错误但却回答正确了。 亮点3,反幻觉方法的路径是,RAG、编辑、归因...通过归因编辑来追溯性地让大语言模型有能力将生成结果归因到外部证据。实验中,通过提示GPT-4创建了一个用于评判模型和生成模型的监督数据集,然后将它蒸馏到一个内部模型中,降低了推理成本。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,人类只有一个大脑处理变化世界中的复杂任务,机器人也应该只有一个聪明的“大脑”,这个端到端的多模态大模型“大脑”应该具有视觉、语言、行动的协调性能力,像人类一样在所处环境中建立长期记忆,实现“反馈-调节”的环境交互执行能力,也就是我们常说的“知行合一”。 全球AI要闻,谷歌用Gemini模型训练机器人具有长记忆。 Google正在使用Gemini大模型训练机器人,结合长记忆提出了一种分层的视觉-语言-行动的自主导航模型Mobility VLA。 DeepMind论文详细介绍了Gemini 1.5 Pro模型的上下文窗口,如何让机器人RT-2使用简单的指令进行导航和完成任务。这项技术的工作原理是拍摄指定区域的视频,研究人员使用Gemini 1.5 Pro让机器人观看视频来了解环境。然后,机器人能根据实际情况,使用口头或图像输出执行命令。 谷歌DeepMind团队说, Gemini模型驱动的机器人在 9000 多平方英尺的操作区域内,对50多条用户指令的执行成功率高达90%。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,传统视频节目先制作、后发行播出,互联网上的长短视频也是串行生产工作流程,但人工智能时代,伴随视频生成的内容质量与速度逐渐提升、算力成本持续下降,视频生成与全网播放的时间差变得越来越小,直到按需实时生成视频,绝大部分影视、游戏、互联网的视频由AI生成,又一次新的AI文艺复兴开始了。 全球AI要闻,Runway CEO预测,2年内视频大模型将有3次大迭代。 7月12日,视频生成创业公司Runway的CEO Cristóbal Valenzuela在X社交媒体上预测,在未来24个月内,根据GenAI发展速度,媒体行业、娱乐业将发生五大变化,包括生成音频、视频、图像任何媒体格式的成本都将接近AI推理算力成本,值得关注的是,未来至少将有3到4次视频模型的大飞跃。 随着GenAI技术迭代,实时媒体生成将适用于所有格式,而大多数视觉模型都可以实现像素级、细粒度控制。我们将会发现出现一批新型视频内容制作方,利用传统软件和AIGV新型管道相结合的方式生产制作娱乐节目。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,当今人工智能最大的矛盾,在于飞速增长的社会应用需求与有限的算力供给之间的尖锐冲突,供需不平衡引发了一系列的AI基础软硬件创新,加速算法、新型算力芯片层出不穷,以弥补逐渐变慢的摩尔定律。 全球AI要闻,Transformer最新加速技术,将H100芯片利用率提升到75%。 FlashAttention是对注意力计算进行重新排序的算法,被广泛用于加速当今一统天下的Transformers大模型架构。时隔一年后,该技术推出了第三代更新,在FP16精度模式下,速度达到740 TFLOPS,这是H100芯片理论最大FLOPS利用率的75%。 FlashAttentionv1版、v2版以及最新的v3版作者也是Mamba架构的共同第一作者,普林斯顿大学助理教授Tri Dao。 未来,FlashAttention新版将被集成到Meta研发的全球最流行的PyTorch训练框架中,目前发布了用于Beta测试版源代码。 在保持准确性的同时,使用FP8这样的低精度,性能能够接近1.2 PFLOPS。这不仅加快了处理速度,还能减少内存使用,从而为运行大规模AI操作的客户节省巨额成本、提高算力效率。通过加速注意力机制,FlashAttention v3使AI模型能够更高效地处理更长的文本。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,基础科研对人类文明发展、国家竞争力提升作用巨大,1925年狭义相对论、量子力学理论的涌现,为人类带来了半导体、计算机、激光、核能等超过一百年的科学红利,今日人工智能逻辑推理能力快速提升,为率先取得科研突破性进展,全球尤其是美国科研机构,积极开展与OpenAI、DeepMind等AI公司的深度合作,已经不断在新材料、新能源、医药等领域取得重大价值,我国科学智能的发展仍处于起步期。 全球AI要闻,OpenAI与美国国家实验室战略牵手,落地AI for Science! 7月10日,OpenAI宣布正在和美国领先的国家实验室之一,洛斯阿拉莫斯国家实验室 (LANL)合作,以了解科学家首次在实验室环境中安全地使用多模态AI模型,推动生物科学研究。最近,美国白宫发布对安全使用的AI行政命令,要求美国能源部的国家实验室帮助评估前沿AI模型的能力,包括生物能力。OpenAI称这非常重要,AI有可能成倍提升科学研究速度。 目前,Moderna正在利用OpenAI 的技术,通过构建一个数据分析助手来帮助分析大型数据集,增强临床试验的开发。双方正在开展一项评估研究,包括对GPT-4o以及目前尚未发布的实时语音系统进行生物安全性评估,来了解如何利用AI支持生物科研,包括细胞培养、细胞分离、转化等。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,在数千年进化过程中,人类智能获得的交流、逻辑思考、行动力、创新力、协同力,正在人工智能技术上重现、强化,目的是让人类成长为人机协同的“超级人类”。 全球AI要闻,OpenAI宣布五级AI路线图,当前智能处于第2级。 据彭博社独家报道,本周二OpenAI在全员大会上提出了一套由5个级别组成的AI能力框架,用于跟踪智能程度进展,并认为目前他们已接近第2级水平。OpenAI计划将这些等级与投资者和公司外部的其他人分享。 第一级智能是语言聊天机器人Chatbot,第二级智能是“推理者”,这里指的是能够像没有使用任何工具的博士学位水平人类一样执行基本问题解决任务的系统。OpenAI领导层展示了涉及GPT-4模型的研究项目,内部测试了一些达到类似人类推理水平的新技能。第三级智能被称为“代理人”Agent,意味着AI能够在用户授权下连续几天采取行动的人工智能系统。第四级智能叫做“创新者”Innovator,描述的是能够提出创新方案的人工智能。而最高级第五级智能被称为“组织”,AI能完成一个组织的复杂工作。这个智能等级体系是由OpenAI高管和高级领导层共同制定的,并将开展持续研发工作。公司将从员工、投资者和董事会成员等人那里收集反馈,随着时间的推移对等级进行调整。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,武汉等城市的很多消费者已经尝鲜了无人驾驶出租车,目前尚处于市场投放验证阶段,长期商业模式仍有待进一步技术改良否则属于赔本推广,同时应该关注原有网约车司机的新型就业出路问题。 全球AI要闻,给无人驾驶网约车算算账,每天成本471元。 7月8日,北京市经信局就支持自动驾驶汽车用于网约车等征求意见,上海、长沙、武汉等地正促进无人驾驶汽车商业化落地。百度公司CEO李彦宏称第一季度武汉全无人驾驶订单比例已超55%。据晚点财经测算,按照武汉市交通运输局对媒体说法,现在萝卜快跑在当地运营400多辆无人驾驶出租车,都是Apollo第五代车。 此前百度副总裁、自动驾驶技术部总经理王云鹏说包括整车以及无人驾驶套件等在内,Apollo 第五代无人车的各项成本总计48万元,且车辆可确保5年内的可靠运营,每天就是263元。在现役运行车辆中,算上单日远程安全员成本、电费,不计入前期巨额研发投入、高精地图更新、车险情况下,单日运营成本5年分摊后,每天约471元。 在收入端,萝卜快跑应用程序显示,在武汉经开区,5公里左右的订单补贴后约5元。无人驾驶出租车需要产生更高流水,或实现更低的成本,才能在竞争中胜出。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,AI芯片公司的护城河其实是AI基础软件,例如英伟达的Cuda、Omniverse,AMD等芯片竞争者正在通过收购模型研发团队追赶英伟达。[建筑外的绿色招牌 描述已自动生成] 全球AI要闻,AMD花6.65亿美元现金收购欧洲AI实验室。 7月10日,全球芯片公司AMD宣布用6.65亿美金收购位于芬兰的欧洲最大私人AI实验室Silo AI,而且是全现金收购。[文本 描述已自动生成] AMD官网称,该协议代表着该公司基于开放标准与全球人工智能生态系统建立了强有力的合作伙伴关系,提供端到端人工智能解决方案的战略又迈出了重要一步。Silo AI团队是一家私人AI实验室,主要为在云、嵌入式和端点计算市场的领先企业开发量身定制的人工智能模型、平台和解决方案。该公司客户包括安联、飞利浦、劳斯莱斯和联合利华。最显著的成就之一是开发了基于AMD平台的开源多语言大模型Poro和Viking。AMD正在加速部局,希望缩小与英伟达差距。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧