第193集 开源PK闭源模型,利好云计算!

田丰说

开源模型不是“免费的蛋糕”,而是科技巨头抢夺AI新市场的战略利器。 硅谷头部风险投资人Elad Gil曾经投资了Perplexity、Character.ai、Mistral、Harvy、Pika等AI创企,他日前与Chapter One投资人对谈时说,未来3到5年内,AI领域将继续呈现寡头垄断的局面,主要由OpenAI、谷歌、Anthropic等闭源大模型头部公司主导。如果Meta的Llama系列、Mistral AI等开源模型性能能赶上闭源领先者,会显著改变行业格局。 观点1,开源模型和闭源模型的齐头并进,会将大量经济价值从闭源模型提供商转移到云服务商,因为云服务商将以非常高效的方式运行这些开源模型。 观点2,企业客户都希望他们的数据与模型部署在同一个云上,而不是在时间上承担多云往返请求的成本。企业客户愿意使用微软云Azure市场的积分来支付,而不必通过独立采购流程。 观点3,后续GPT-4到GPT-5等每次新模型发布,都会打开全新的市场,新版模型的超能力会打开10个、甚至100个新市场,现在正处于每2年创新周期的巨大曲线上。 观点4,关于全球大模型市场格局,有一个很少被提到的关键因素,是区域政府会在多大程度上支持“区域模型”。比如空客、波音背后不同政府的支持力度。如果所有欧洲政府都在支持两家LLM,那可能会成为AI巨头。 观点5,美国基本上关闭了核能发展的潜力,这阻碍了原本更便宜、更清洁、更安全的AI技术进一步发展。 家人们的点赞、收藏、分享,是对田老师录课的最大支持!关注《田丰说》,每天3分钟,掌握全球AI大事件,本视频由商汤“如影”数字人APP生成。

1分钟
12
1年前

第192集 DeepMind新架构,跨越ChatGPT山谷!

田丰说

今天田老师给家人们带来人工智能领域的颠覆式创新视角。DeepMind CEO认为,开发下一代Transformer架构,帮助人类跨越“ChatGPT山谷”。 8月15日,谷歌DeepMind CEO Demis Hassabis与著名数学家Hannah Fry对谈时提出,短期内AI被过度炒作,在接近通用人工智能AGI的阶段仍然被低估。Hassabis称DeepMind已成为谷歌的AI引擎,目前正大力加强AI基础研究,比如开发下一代Transformer架构,他们已将Transformer与Deep Reinforcement Learning相结合,未来会给人类带来更多创新。Hassabis指出,目前业内对模型缺少正确的基准测试,包括能力反馈和安全反馈。现在大模型的底层进展是基于5年前的老一代技术,导致模型经常出现“幻觉”,在任务规划方面也不够好。如图所说,ChatGPT只是通向AGI的局部最小值。 观点1,下一代AI系统的目标是“自学智能体”,DeepMind将智能体擅长的领域与多模态模型结合起来,可以看做把AlphaGo与Gemini结合在一起。 观点2,相当有趣的是,现在开发AI产品所需的技术和AGI研究技术间的差异越来越小。5年前,开发AI产品需要定制化,如今产品特定工作只占10%。实际上,二者研究计划中的90%是相同的。然后,当AI产品推向市场后,大量用户反馈让你更好地调整模型指标。 观点3,未来模型需要更多的安全检查,恰当的策略是发布大模型1到2年后再开源。谷歌开源模型叫Gemma,会落后于前沿研模型1年左右,这样在公开测试中能真正评估模型的能力。 观点4,未来模型肯定能在国际奥数竞赛中赢得金牌,甚至能解决一些著名的数学猜想。模型有没有能力自己提出假设?这是我衡量通用人工智能的关键标准。 关注《田丰说》,每天3分钟,掌握全球AI大事件!家人们的点赞、收藏、分享,是对田老师录课的最大支持!本视频由商汤“如影”数字人APP生成。

2分钟
29
1年前

第191集 大模型“吞金兽”如何赚钱?

田丰说

大模型是“吞金兽”,那靠什么赚钱呢?今天田老师给家人们讲一讲,为什么达到人类专家水平的推理能力是AI商业的未来,下一代基础模型将可能远远超出当今行业模式服务能力。 近日,Perplexity公司CEO预测,下一波“推理爆发”将彻底改变AI商业。 AI是否到了一个收益递减的阶段?Perplexity AI搜索创企的CEO Aravind Srinivas在《20VC》播客节目中说,模型规模增大带来性能收益有限,最大的好处是确保数据管理效率、计算效率。数据质量、数据多样性、混合专家模型的计算效率是提升模型性能的核心关键。Aravind强调,月付20美元的订阅制商业模式不够好,Perplexity未来盈利引擎靠广告,当模型推理提升到一定高度,将打破订阅制商业模式,用户有可能愿意为单次高质量输出付费。他提醒市场,AI产品从来都不是模型,必须把两者分开。基础模型的竞争玩家就5家,赢面取决于谁先破解自学推理。 亮点1,当马斯克的xAI公司开源Grok-1模型时,Arthur AI评估说,这个模型有很多多余的参数,作为300B参数模型,甚至还不如法国Mistral 56B的性能效果。 亮点2,GPT-3.75级别的模型已经被商品化了,第二梯队的模型将成为通用商品,但创造前沿模型的人才和团队将保持极高价值,基础模型商品化的最大受益者是应用层公司。 亮点3,模型的垂直化发展也存在缺陷,微调只是应用的一小部分计算能力。模型的“魔法”来自于通用自发能力,即在没有专门训练的情况下完成任务。你可以向模型输入大量企业数据,但这并不意味着模型将会获得一种无法从互联网上获得的全新推理能力。 亮点4,xAI最近聘请到斯坦福大学Eric Zelikman博士,他擅长自学推理器,让模型本身来解释自己的输出。这是现在模型所缺乏的能力,未来的新一代模型将从输出推理开始,从世界获得反馈,再改进推理,实现这个过程需要3到4年时间。 亮点5,OpenAI公司创始人Sam Altman并不关心利润,因为他对产品这门生意不感兴趣,他在尝试建立AGI通用人工智能。 关注《田丰说》,每天3分钟,掌握全球AI大事件!家人们的点赞、收藏、分享,是对田老师录课的最大支持!本视频由商汤“如影”数字人APP生成。

2分钟
17
1年前

第190集 商汤招聘:少侠请看“英雄帖”!

田丰说

各位少侠请留步,田老师的AI战略团队要招“武林高手”了!没错,就是商汤科技智能产业研究院正在寻找一位能驾驭AI治理与科技战略研究的“超级英雄”,地点就在宇宙尽头的北京中关村,在中国科技创新的大本营发奋学习、茁壮成长! 你的每天工作有哪些呢? 第一,作为AI合规风控大师,你得成为政策法规的活字典,构建一套让公司AI产品既合乎伦理又能规避风险的安全网。同时,还得时刻关注国内外AI界的新动向,预测可能出现的新风险,就像福尔摩斯一样洞察一切。 第二,作为AI战略研究奇才,你会深入调研咱们的客户高管,挖掘他们使用我们产品的“智能向善”故事,通过案例、白皮书、畅销书、论坛演讲等方式,让全世界知道商汤治理AI发展与伦理道德的。 第三,作为高校智库研究联络官,你会常和清华大学、上海交通大学等名校教授联手,一起搞研究、开研讨会,为公司的业务发展添砖加瓦。 第四,作为AI伦理的国际合作大使,你需要向外国友人讲述中国故事,推动公司拿到ISO42001之类的国际认证,提升公司的国际形象和客户的信任度。 第五,少侠肯定是个全能多面手,随时准备支持公司战略相关的其他AI战略研究或战略营销任务。 少侠需要具备哪些“超能力”呢? 第一个超能力,学历与背景上,需要硕士及以上,理工科出身最佳,最好是来自名牌大学,英语流利加分。 第二个超能力,AI安全与审计的专业经验,需要熟悉ISO、BSI等国际标准,有ISO42001等AI安全认证经验的优先加盟。 第三个超能力,行业洞察能力比较犀利,对AI产业如数家珍,痴迷于追踪思考全球AI最前沿技术趋势,具备优秀的报告撰写能力。 第四个超能力,个人品质必然有大侠风范,比如有创业精神,善于批判性思考,不怕吃苦,抗压能力出众,乐于助人,有过社会公益活动经历更佳。 第五个超能力,职业规划立志报效祖国,能在商汤长期奋斗,频繁跳槽、朝秦暮楚的小伙伴就不必看啦,有科技公司内部审核或ISO标准咨询经验者优先。 少侠,英雄不问出处,有志不在年高,如果你相信自己就是我们要找的“超级英雄”,快快把简历飞鸽传书到田老师邮箱吧 [email protected]!记得附上你的过往作品哦,比如研究报告、文章或者你在自媒体上的精彩瞬间。

2分钟
23
1年前

第189集 AI大神李沐的创业故事!(下集)

田丰说

马斯克曾经说过:“创业就是嚼着碎玻璃凝视深渊。”人人眼中的AI大神,躬身入局创业时同样会意外频发、历尽艰辛、品味人生百态。田老师接着上集,给家人们继续讲AI创业故事。 第一,AI创业靠什么赚钱?目前最大的支出是人力和算力,收入主要靠给大客户做定制化模型,第一年收支已做到能打平。2023年创业前半年,李沐发现做不动GPT-4,快速找客户问题,聚焦游戏、教育、销售、金融、保险的行业问题,后来好的开源模型帮助降低成本。2023年底时,始终能保持应用效果匹敌GPT-4时,推理成本是OpenAI价格的1/10。创业后半年,客户反馈要的不是普通人类水平的模型,而是相当于专业人士的AI能力,游戏客户需要专业策划、专业演员,教育客户需要金牌教师,营销客户需要金牌销售,金融保险需要高级分析师,所以李沐团队重点研发行业场景下的AI专家角色扮演,AI老师、AI销售、AI分析师在第三方评测中效果不错。 第二,AI模型未来在哪里?通用模型能力、垂直模型能力都要向AGI齐头并进,推理、指令跟随等都是关键能力,而垂直模型能力应稍微偏科,研发投入有多倾斜,专业课力争考高分,通用课还行就可以。未来的AI生产力工具很发达,一个人就能完成现在一个团队的事情,人类会更加孤独,所以我们更需要“人类陪伴的智能体”,情商很高、智商在线,AI像一个助理团队陪着你,类比“专业策划+演员”、“鼓励师+专业运动教练”的多角色扮演。 第三,创业者需要什么性格品质?李沐坦言是乐观。整体来说行业和资本对大模型创业还是急躁的。2024年好几家成立刚一年多、融资上十亿的AI创业公司选择退出。从技术到产品是一个很长的过程,花2到3年实属正常,算上用户的需求涌现,可能要花更长时间。所以“我们专注当下在迷雾中探路,对未来保持乐观。” 关注《田丰说》,每天3分钟,掌握全球AI大事件!家人们的点赞、收藏、分享,是对田老师录课的最大支持!本视频由商汤“如影”数字人APP生成。

2分钟
27
1年前

第188集 AI大神李沐的创业故事!(上集)

田丰说

马斯克曾经说过:“创业就是嚼着碎玻璃凝视深渊。”人人眼中的AI大神,躬身入局创业时同样会意外频发、历尽艰辛、品味人生百态。 近日,前亚马逊首席科学家李沐在知乎上发表了《创业一年,人间三年》文章,引发网友广泛热议。他分享了几点创业感悟: 第一,为什么要创业?李沐说,创业的动机要么来自欲望,要么来自恐惧。十年前更热衷名利,现在深层动机来自于对生命无意义的恐惧,地球上曾经生活过一千亿人,但绝大部分人不会在历史上留下痕迹,李沐读博、工作、做视频、创业,是在不断追求一个人存在的意义,团结很多人的力量去创造更大的价值。 第二,创业做什么?2022年底,李沐和张一鸣说,想用大语言模型做生产力工具,张一鸣反问“为什么不做大语言模型本身?”李沐坦言在做模型本身困难重重、算力昂贵,张一鸣呵呵一笑说:“这些都是短期困难,眼光得看长远。”于是,李沐锚定大语言模型研发方向。 第三,创业最难的是什么?接受意外,第一批吃螃蟹吃到怀疑人生。为了买GPU卡融资,但签字前一天领投的金主机构跑了,几家跟投的也退出,但剩下的投资方给了李沐团队大模型创业的“入场券”。然后采购英伟达H100芯片发现要等到一年后才能到货,于是直接写邮件给黄仁勋,20天拿到机器。之后,用千卡集群训练一次大模型被打断几百次,遇到无数匪夷所思的Bug,小创企为英伟达提供debug方案。创业就是逆天改命,永远不要考虑退路。 第四,创业最重要的是什么?人才对大厂是螺丝钉,但是创业企业的生命线。创业团队就是一辆车,小车能跑各种地形、能载重、转弯灵活,但时刻要关注有没有油、车会不会跑散架,团队没有冗余备份,每个成员都很重要,走一个人就少一个轮胎,所以创业全靠团队。 本故事分为上、下两集,下集请关注《田丰说》,家人们的点赞、收藏、分享,是对田老师录课的最大支持!本视频由商汤“如影”数字人APP生成。

2分钟
49
1年前

第187集 AI应用TOP50排行榜:四大趋势!

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,当今AI应用处于早期,如98年的互联网创新阶段,技术日新月异,用户用脚投票,目前2C的热门应用是AI搜索,而2B需求旺盛的应用是营销场景的AI角色扮演,目前最赚钱、获得市场流量的团队,都是走通了“技术-产品-市场”三级跳的公司,尤其是产品到用户的“最后一公里”,是商业价值变现的关键。 全球AI要闻,ChatGPT占全球AI应用六成流量,AI陪伴转向B端。 根据AI产品Top50榜单,截止7月份,OpenAI的ChatGPT一家独占全球AI产品总流量的60%,并且优势还在进一步扩大。榜单还反映出更多市场趋势,第一,AI写作和AI代码生成下降较为明显,人们的兴趣正在下降。第二,AI搜索成为2024上半年AI应用赛道的赢家,7月上榜AI搜索应用数量变成8个,翻了一倍。第三,分析机构SimilarWeb认为,AI聊天类产品正在从C端向B端扩展,融入大模型、多模态的AI角色扮演服务,被客户更多应用于市场营销、电子商务类产品。第四,对比7月和1月榜单,共有9个AI产品跌出榜单,月访问量普遍在1400万以下,这个流量值是AI应用成败分水岭。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,请点赞、收藏、分享加关注!

1分钟
74
1年前

第186集 谷歌Gemini重新定义手机

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,手机仍是当今社会最普及、最高效的AI终端,而且通过摄像头、麦克风、触摸屏等传感器,用户十分熟悉各种文字、语音、视觉交互方式,所以多模态大模型正在重新定义AI手机等移动终端。正如商汤科技CEO徐立博士在7月发布会时所说:“希望所有智能音箱、智能车载、智能眼镜,都来接上我们的端侧大模型。让大家真正用得起人工智能的大模型,AI才会进入它的超级时刻。”目前商汤端侧大模型每台使用成本一年仅需9.9元。 全球AI要闻,谷歌Gemini助手重构体验,AI深入安卓生态。 8月14日,谷歌在“Made By Google”大会上发布了Gemini助手,探索性实现多步骤推理、自主计划调用和记忆力等AI新能力,与安卓操作系统深度集成,因此安卓成为全球首个标配多模态AI模型的移动操作系统,支持200多个国家地区和45种语言,覆盖数十亿台设备,Gemini成为世界上使用最广泛的AI助手。同时,谷歌将Gemini助手无缝集成到折叠屏手机、智能手表、耳机等各类生态硬件中。Gemini通过谷歌端到端安全架构,确保硬件信息的安全和隐私。谷歌Gemini产品对标OpenAI家的GPT-4o高级语音人机交互功能,虽然谷歌现场演示Gemini Live时“翻车”了2次。另外,目前Gemini还不支持多模态输入,将在年内开放。 亮点1,Gemini与所有谷歌应用集成一体,能在多个谷歌系应用中随意调用相互联动。例如用户语音召唤Gemini助手,读懂屏幕内容,或在用户观看YouTube精彩视频时,针对视频内容提问,也可以让Gemini将视频中地址等信息提取出列表,再添加到谷歌地图等其他应用中。 亮点2,Gemini将个人数据与谷歌汇编的所有知识联系起来,例如,根据私人教练的电子邮件帮助制定日常锻炼计划,或使用Google Drive中的文档撰写工作简述。 亮点3,谷歌发布会重点强调了“重新定义手机”的用法,Pixel 9系列手机每秒能产生高达45个词元tokens的移动输出率,谷歌还与小米、OPPO等中国手机品牌展开合作。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,请点赞、收藏、分享加关注!

3分钟
12
1年前

第184集 马斯克Grok-2,擅长聊天!

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,应用场景决定数据特征,数据特征决定模型优势能力。X社交网络充满包含各种情感、社会观念的人类聊天文本、视频数据,训练出的Grok模型同样具有不错的对话能力,而推理、编程方面的数据可能来自于特斯拉、SpaceX等马斯克旗下科技公司。 全球AI要闻,马斯克发布Grok-2测试版大模型,性能全球第四。 8月14日,xAI发布了Grok-2和Grok-2mini模型的测试版,这距离1.5版本只有4个月时间,尚未采用Memphis AI超算中心的10万块H100集群,而是投入了2万块H100来训练。Grok-2模型在聊天、编程和推理方面有显著改进,在硅谷著名的LMSYS排行榜上,表现优于Anthropic公司的Claude 3.5 Sonnet和OpenAI公司的GPT-4-Turbo。马斯克说,模型目前处于β测试阶段,本月下旬面向企业的大模型API也将上线开放平台,实现跨区域低延迟访问。目前,xAI仍是一个超小型的精英团队,对比其他模型公司组织规模小一个数量级。Grok-2模型目前仅限 X上的付费用户访问。 亮点1,Grok使用了Black Forest Labs公司开源的FLUX.1来生成图像,网友实测图像生成,对创建全球政治人物图像方面没有任何限制,面对潜在风险的保护措施仍有待提高。 亮点2,目前Grok-3在训练数据方面遇到了挑战,团队在考虑将合成数据、视频数据添加到Grok 3的训练语料库中。 亮点3,本周马斯克与特朗普直播对谈时指出,AI所需电力几乎已达美国可提供电力的2倍,核能是一个被低估的重要发电方式。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,请点赞、收藏、分享加关注!

2分钟
11
1年前

第183集 Waymo CEO:如何让AI变为老司机?

田丰说

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。 田老师认为,物理世界是一个纷繁复杂、灵活多变的环境,属于复杂巨系统,人工智能必须像人一样积累足够的数据才能“见多识广”、“随机应变”,尤其是在自动驾驶这种高安全性要求的行业领域,所以训练数据的规模,即模拟与测试行驶的里程数必须成千上万倍扩张,且成本持续降低,即通过规模来获得物理世界的驾驶经验,让AI变成老司机。 全球AI要闻,Waymo CEO分享,当前AI面对的最大问题和趋势。 美国风险投资公司A16z观察分析,当前大语言模型浪潮中,出现了一场巨大的降成本竞赛。许多人认为这是一种商品化过程,而自动驾驶领域竞争者越来越少,源于该领域对错误的零容忍,要求异常严苛。日前,Alphabet旗下的自动驾驶公司Waymo CEO Dmitri Dolgov与A16z合伙人David George对谈,Dmitri指出Waymo正在构建一个“通用驾驶员”模型。当前乘客叫车服务是最成熟的互联网应用,未来Waymo的AI驾驶员将部署在其他商业应用场景,比如送货、卡车运输、私家车,甚至与Uber合作。之前谷歌母公司Alphabet在财报会上,曾宣布将向Waymo额外投资50亿美元,分多年进行。据Dmitri透露,目前Waymo智能车已经在全自动驾驶模式下行驶了超过1500万英里,在仿真环境中行驶了数百亿英里,持续扩大数据规模。“在模拟传感器、感知现实方面,必须是逼真的。” Dmitri认为,针对AI的最大问题是,需要将算力、数据、模型的规模提升到下一个数量级,甚至是跨越多个数量级。随之在产品侧迭代、改进应用体验,同步获得用户反馈十分关键。他强调,现在看到一个普遍趋势,训练一个巨大的模型,然后将其提炼成一个小模型,比直接训练小模型效果要好得多。 每天3分钟,掌握全球AI大事件!《田丰说》全网发布,请点赞、收藏、分享加关注!

2分钟
27
1年前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧