第158集 微软CEO透露新十年战略!

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,微软、谷歌、Meta等美国科技巨头,已经掀开了全球新一轮AI云基础设施建设浪潮,今年只是AI基建的开端,每家巨头自研AI芯片、同时投入数百亿美元建设、租赁新数据中心,从2025到2030年科技巨头将持续投入数千亿美元,堪称美国新一轮“登月计划”,其中全球第三大AI芯片厂商谷歌具有半导体供应链的先发优势,微软、特斯拉、OpenAI都在自研芯片,建议我国加速提升AI芯片产能,并保障AI基础设施的供应链与产能的稳定提升。 全球AI要闻,微软CEO纳德拉说,未来十年战略最关注两大基本面。 面对业内关于“GenAI所需的资本支出与变现前景之间是否匹配?”的争议,微软CEO纳德拉回应强调“长期运营杠杆”的重要性。“GenAI是知识密集型和资本密集型转型,产品组合不仅要为用户提供优质的基础设施,同时也要保证良好的软件服务。如何将产品价值有效传递给用户?产品使用率是多少?这才是首要考虑的问题。” 微软正在经历AI平台变革期,纳德拉专注两个基本方面:一是推动包括基础设施和整个产品组合的创新,以确保机会价值最大化。二是继续扩大云业务,通过遍布全球的长期资产建设,推动未来十年的增长。 亮点1,付费的Maas模型即服务客户数量环比增长了一倍以上,微软看到各行各业的领导者都在增加AI使用率,从Adobe、Bridgestone、Novo Nordisk到Palantir都如此。Azure AI的云侧客户规模达到了6万家,比上一财季的5.3万家显著提升,比2023年增长了60%。 亮点2,微软云毛利率约为70%,同比下降主要是由于扩大AI基础设施的影响。考虑到微软对云和AI的需求,以及现有AI容量限制,预计资本支出将环比增加。 亮点3,预计25财年的资本支出将高于24财年。本季度资本支出达190亿美元,比上季度140亿美元提升36%,云计算和AI相关支出几乎占资本支出的全部,其中大约一半预算用于建设和租赁数据中心。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,请点赞、收藏加关注!

3分钟
8
1年前

第157集 全球首例ChatGPT接入“脑机接口”!

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,具有环境感知、语言交互能力的AI模型,会逐步成为残障人士的“超级外脑”,提供适应环境的备选方案、与他人交流的语言助手。 全球AI要闻,Synchron公司首次将ChatGPT集成到脑机接口。 近日,美国一家提供植入式脑机接口BCI技术的Synchron公司,宣布将OpenAI技术集成到其BCI平台的聊天功能中,能为使用者提供生成式聊天功能,这项创新技术是全球首家,通过微创手术将名为stentrode的设备植入靠近大脑运动皮层的血管中,为瘫痪患者提供更便捷的数字设备控制方式。该系统通过读取大脑电信号并将其无线传输到外部设备,结合ChatGPT的自然语言处理能力后,显著提高了人机沟通效率。 用户无需逐字输入,通过思考来选择AI生成的答案选项。随着使用时间增加,系统会逐渐适应用户的语言习惯,提供更准确的个性化响应。Synchron公司的BCI设备预计成本在5万到10万美元,与其他植入式医疗设备相当。虽然目前尚未获得美国食品和药物管理局FDA的市场批准,但已在临床试验中展现出积极影响。 Synchron 首席执行官 Tom Oxley 表示,2024年 5 月 OpenAI 发布的 GPT-4o 视频展现了赋能残障人士的新前景,视频中一名视力受损的男子穿梭于城市,让AI描述 周围环境,ChatGPT-4o 甚至告诉他什么时候伸手示意出租车停下。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,请点赞、收藏加关注!

2分钟
10
1年前

第156集 苹果AI大模型解密!

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,苹果智能项目中,体现了谷歌TPU、英伟达GPU之间的激烈竞争,以及OpenAIGPT-4o仍未能达到苹果的高用户体验要求,云端一体模型架构会逐渐成为全球标准,今年上半年商汤已经发布了端侧小模型,并将终端包年价格降至9.9元,中国在AI应用创新上有望领先美国。 全球AI要闻,苹果基础大模型解密,训练时没用英伟达GPU。 7月30日,苹果发布了iOS18.1和 iPadOS 18.1测试版,只向开发人员推出了AppleIntelligence苹果智能。同时苹果分享了47页的技术报告,端到端评测结果显示,苹果云端大模型超过了GPT-4,包括指令遵循、文本总结等任务能力。“苹果智能”功能具有全新版Siri,唤醒时在屏幕边缘亮光,体现了苹果的设计美感,当Siri与用户交流时,能在文本、语音之间随意切换,人类用户直接用自然语言搜索照片、生成邮件的AI摘要等。苹果基础大模型AFM负责人庞若鸣表示,这些基础模型“并不是聊天机器人”,而是支持包括摘要、写作帮助、工具使用和代码等功能的智能体。 亮点1,苹果大模型训练用的是谷歌TPU集群,云侧用了8192颗TPU v4芯片,端侧用了2048颗TPU v5p芯片,通过自家基于JAX的AXLearn框架进行训练。 亮点2,数据主要来源于Applebot爬取的互联网网页,以及有公共许可的代码库、数学数据集。苹果选用的数据集中没有使用GPL协议,都是MIT、Apache、CC0等开放程度更高的开源协议。 亮点3,苹果AI的核心是云侧模型AFM-server,数据量6.3T tokens,使用私有云系统来保护用户数据,蒸馏得到30亿参数的端侧模型AFM-on-device,云侧与端侧模型都是32k上下文,通过LoRA 适配器,模型能根据特定任务进行动态调整。 亮点4,苹果AI的后训练使用了合成数据与人类标注数据,合成数据主要关于数学、工具使用和代码。在RLHF优化阶段,苹果自创了iTeC和MDLOO两种强化学习算法,并对端侧进行了混合精度量化。 亮点5,苹果表示将在明年2025年推出,包括集成ChatGPT、图像/Emoji生成、照片自动清理、具有屏幕感知的超强版Siri。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,请点赞、收藏加关注!

3分钟
10
1年前

第155集 扎克伯格对话黄仁勋揭秘“软件3.0时代”!

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,扎克伯格用Llama系列开源大模型策略统一全球AI供应链,力图打造开放型AIGC操作系统Horizon OS,并通过AR眼镜走入现实生活场景,黄仁勋则憧憬每个人都能按照自己的思想、知识、数据定制化复刻一个AI智能体,在生活、工作中不断微调。 全球AI要闻,扎克伯格和黄仁勋提出,软件3.0时代已到来! 7月30日,Meta创始人扎克伯格与英伟达CEO黄仁勋,在SIGGRAPH大会上深度对谈,小扎表示AI正在彻底改变社交媒体平台的运作方式。未来Facebook和Instagram将会成为一个统一的AI模型,特别是推荐系统的颠覆式创新,他预测未来的多媒体内容不仅会基于用户兴趣进行推荐,还会由AIGC工具实时创作、实时合成。 小札认为,智能体是AI产品的下一个形态。每个人都会有一个创造性AI,每家企业都拥有一个与客户交互的AI智能体。人们现在只关注移动设备,但以Llama模型为首的开源系统将成为打败苹果封闭生态圈的关键基础。正如在PC时代,开放的生态系统获胜了。扎克伯格说:“我希望在下一代计算中,开源AI将会为Meta赢得胜利。”黄仁勋则强调:“现在我们基本上处于软件3.0时代,生成式AI都是这一根本性转变的核心。” 亮点1,Meta AI的主要用例是人们用来模拟社交场景、专业场景,例如“我想向经理询问如何获得晋升或加薪?”,或者是和朋友的争执,模拟这种对话,看看问答双方会如何演进,并获得有价值的反馈。 亮点2,每个企业的智能体产生数据,用户与AI交互会捕捉到企业级知识,对这些知识的进一步分析持续改进AI ,如此循环往复。 亮点3,AI最终会变成需要数周或数月的计算任务,并在世界上发生某些事情时主动告知你处理方法,我们需要花至少五年才能挖掘出智能体的全部产品潜力。 亮点4,未来的一大问题是,人们将在多大程度上使用更大、更复杂的模型,而不仅仅是通过个性化需求训练模型。扎克伯格坚信,未来会有各种各样、数量庞大的不同模型涌现。 亮点5,下一波趋势,英伟达正通过视频数据训练AI模型,让AI更好地理解世界模型,并将这些模型接入Omniverse平台,落地机器人技术、工业数字化等应用场景。 亮点6,扎克伯格认为,智能眼镜类似于手机,是常驻型计算平台的下一个版本。而混合现实头显则更像你的工作站或游戏主机。我们制造的雷朋眼镜,目前还无法将全息AR完全融入,未来价格降至300美元的智能眼镜将成为爆品。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,请点赞、收藏加关注!

3分钟
20
1年前

第154集 全球最大“开源多模态数据集”问世!

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,在人工智能的尺度定律中,数据越广、算力越大、则模型越强的趋势规律,推动研发机构追求更大规模、更多元化、更高质量的数据集,全球开发者偏爱免费的开源数据集,而开源数据中蕴含着世界认知、环境特点、文化价值,我国应在开源多模态数据集上加速建设,与美国硅谷缩小差距。 全球AI要闻,全球最大多模态数据集诞生,万亿token规模。 近日,美国华盛顿大学、Salesforce Research、斯坦福大学等机构组成的联合团队构建了一个万亿token级的交织多模态开源数据集MINT-1T,这是目前最大的开源多模态数据集。共包含一万亿文本token和三十亿张图像,包括HTML、PDF、ArXiv等多种不同来源。在 MINT-1T数据集问世之前,该领域最大的开源数据集是OBELICS。为了提高MINT-1T数据质量和安全性,研发团队执行了文本质量过滤、图像过滤、安全过滤、去重等操作。引人注目的是,整个数据处理过程耗费了大约420万个CPU小时数。由MINT-1T混合数据上训练的模型,在全球大多数评测基准得分都优于由OBELICS数据集训练的模型。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!

1分钟
13
1年前

第152集 纯合成数据会让AI变傻吗?

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,将来自于物理数据、人类数据、科学推理逻辑作为“种子”,进行合成和扩展获得混合数据,正在成为大模型产业的必经之路,建议中国把工业企业数据、高校数学数据、科研院所思维链数据共享、汇编为训练数据种子,由国家平台向基础模型研发机构开放,将显著提速我国人工智能科研创新速度。 全球AI要闻,混合数据才是未来,并非纯合成数据。 近日,《自然》杂志封面论文表明,随着新一代模型连续在合成数据上进行递归训练,模型会崩溃。Scale AI公司CEO Alexandr Wang对此深表赞同,强调利用纯合成数据来训练模型,都会丢失一些信息和精度。而混合数据才是未来发展方向,它能够避免所有与模型崩溃相关的风险。“数据墙”、生成新数据的难度是一个大模型发展遇到的真问题,但并非不能克服,答案就是混合数据,即人类专家利用合成方法产生大量数据,将大幅提高产量。超越多轮推理的前沿数据将变得更有价值,这就是我们突破数据墙的方法。 亮点1,A16z合伙人Martin Casado指出,现在的“多轮数据”非常昂贵。单个答案的价格为20到200美元以上,具体取决于数据质量。这就是为大型语言模型LLM研发所需“新数据”的成本,我们需要更大数量级的训练数据来继续扩展。 亮点2,Wang预测,当今许多研究人员将合成数据视为人工智能的“点金石”,如果在没有信息增益的合成数据上草率进行训练,开发人员会发现模型随时间推移变得越来越奇怪和愚蠢。 亮点3,在混合数据过程中,必须通过某种新信息来源来生成,使用真实世界数据作为种子、人类专家参与、形式逻辑引擎等。 亮点4,在使用合成数据训练新模型时,不仅应关注生成器的质量,还需要一个高质量的验证者来选择数据。 亮点5,一个被忽视的效应是,市场为创建高质量数据所花费的成本越高,模型的质量就越好,从而进一步提高了未来数据的质量标准和所需成本。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!

3分钟
11
1年前

第151集 GenAI推理需求,推动算力增长数年!

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,基础大模型的研发掀起了算力基建浪潮,而伴随大量AIGC应用的普及,“算力饥饿”现象将会持续3年时间,直到新一代更便宜、产能管够的国产化AI芯片推向市场。 全球AI要闻,Gartner预判,AI数据中心支出超预期。 Gartner最新全球IT支出预测,数据中心系统支出将增长24.1%,是3个月前预测数据10%的2倍多,这一切都是因为生成式人工智能GenAI,这种算力增长的影响可能会持续几年时间。英伟达成为AI服务器GPU市场占据主导地位的“头号玩家”,已经解决了大部分供应链问题。全球互联网与AI厂商正在尽可能多地购买GPU芯片,来构建和迎接新一代AI推理浪潮,推理对算力的依赖程度高于训练,“虽然你只构建了一个模型,但全年都在推理使用它”。 Gartner预计,2024年超大规模数据中心企业将在云计算基础设施上花费700亿美元,到2025年将增长到1400亿美元,2028年继续增长到2100亿美元。分析师说:“我们仍然没有看到这些工具的最终状态,我们远没有看到一套大型语言模型的商品状态,甚至没有看到大型语言模型应该具备的基本确定功能。” 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注! #人工智能,#大模型,#AI,#英伟达,#GPU,#数据中心,#AI服务器,#云计算,#数字人,#硅谷,#人工智能+

2分钟
21
1年前

第150集 谷歌AI勇夺“国际奥数”银牌!

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,AI攻克复杂数学,是一个伟大的机器智力里程碑。语言是人类描述世界的符号,“数学是上帝描述自然的符号”,这是黑格尔说的。而笛卡尔认为“数学是知识的工具,也是其他知识工具的源泉。所有研究顺序和度量的科学均和数学有关。”当AI能够学习世界顶级数学家的长链条思考逻辑,人类文明将掌握打开科学大门的万能钥匙。 全球AI要闻,谷歌AI勇夺“国际奥数”银牌,数学推理模型面世。 高级数学推理是现代人工智能一直追求的关键智力。谷歌DeepMind团队推出的混合AI系统在今年国际数学奥林匹克竞赛中考出了银牌成绩。该AI数学模型结合了新型推理模型AlphaProof和改进版模型AlphaGeometry 2,仅差1分就能达到人类金牌标准,而在今年参赛的609名人类参赛者中,只有58人获得了金牌成绩。 为了克服形式化语言训练数据不足的问题,研究团队通过微调Gemini模型,创建了一个包含各种难度的形式化题库。在准备IMO国际奥数比赛期间,AlphaProof模型在数周内证明、反驳了数百万个难题,覆盖各种难度和数学专题。在比赛过程中,AI还在继续应用这个训练循环。谷歌正在继续探索推进数学推理的AI方法,并计划很快发布AlphaProof的更多技术细节。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!

2分钟
9
1年前

第149集 微软 vs OpenAI“小模型大战”!

田丰说

微软 vs OpenAI 小模型大战! 关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,OpenAI刚推出免费版GPT-4o mini微调服务,微软就推出云上免配置Phi-3微调服务,初期免费。对于广大财力、算力都不足的开发者来说,不论大模型还是小模型,能为我所用的就是好模型,尤其是目前Phi-3这类30亿小模型能力已经追赶上GPT-3.5水平,已经迈过了全社会推广的能力门槛、价格门槛。 全球AI要闻,微软Phi-3模型重大更新,支持云上“微调”。 7月25日,微软宣布Phi-3-mini和Phi-3-medium均可在微软云Azure上进行微调。微调允许开发人员针对不同用例提高基础模型的性能。例如,针对学生辅导对 Phi-3-medium模型进行微调,也能根据特定语气、答复风格构建聊天应用。 可汗学院等全球创新机构已经在实际的人工智能应用中使用了Phi-3模型。如预期所料,小模型广受欢迎,30亿参数的Phi-3-small模型现在支持用户在云端通过“无服务器微调”使用,支持快速开发人工智能应用。 微软 CEO Nadella说:“我们提供最好、最多样化的模型选择(Azure AI有超过1600种模型可用),以满足客户独特的成本、延迟和定制需求。仅在上周,我们就为Azure AI带来了OpenAI、Meta等公司的最新产品,还更新了我们自己的Phi-3系列小语言模型。” 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!

2分钟
3
1年前

第147集 OpenAI开启“语音搜索”革命!

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,搜索是传统互联网的核心流量入口,而新一代互联网的入口是智能体,智能体比搜索框具有更好的语音交互能力、用户意图理解、多轮追问、指令跟随、广泛工具调用、长期记忆、复杂任务处理等能力,所以搜索作为高频工具插件被嵌入到浏览器、视频播放器、AI编程软件等各种智能体中。 全球AI要闻, OpenAI官宣SearchGPT,万人内测AI搜索。 7月26日,OpenAICEO Sam Altman在X社媒上发布了AI搜索产品SearchGPT,GPT-4 系列模型驱动,并坦言:“搜索还有很大改进空间。我们正在推出SearchGPT的新产品,与老式搜索相比,我更喜欢这种搜索方式。”目前只向10000名测试用户开放内测,计划将AI搜索技术集成到ChatGPT中,实时发挥最大限度的作用。当网友问到:“GPT-4o的语音功能什么时候上线?”SamAltman回应说:“下周向Plus会员推出GPT-4oAlpha版本。”几乎同时,谷歌宣布了Gemini产品的更新,但股价下跌3%。谷歌官方放出的Gemini搜索预览来看,用户只需像和真人对话一样,向谷歌说明搜索要求,即可获得实时响应,支持多轮人机对话。 亮点1,跟传统搜索相比,SearchGPT迅速直接地使用网络上最新信息回应问题,嵌入了多样式答复内容,包括数据、列表、图片、视频、卡片,提供相关资源的链接。通过在搜索结果中显著标明引用链接,关联到出版商,能在侧边栏中与更多结果进行互动。 亮点2,SearchGPT每次查询都共享同一个上下文,比如搜索出了一些西红柿品种后,我们继续追问:“哪些是现在可以种的?”AI会详细列出,在7月明尼苏达州最适合种植的西红柿种子。 亮点3,OpenAI已经与多家头部媒体建立了战略合作,包括《大西洋月刊》、美联社《华尔街日报》、《泰晤士报》、《太阳报》等,并向这些媒体展示了搜索功能的原型应用,合作媒体机构能够自行选择内容来源在SearchGPT中的呈现方式。 亮点4,截止6月搜索市场格局是,谷歌在全球搜索引擎市场中占到了91.05%的份额,微软必应只有3.7%的份额,而Perplexity的份额太低,无法衡量。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!

3分钟
8
1年前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧