评分
暂无评分
0人评价
5星
0%
4星
0%
3星
0%
2星
0%
1星
0%
AI智能总结...
AI/summary > _
AI 正在思考中...
本集内容尚未生成 AI 总结
简介...
https://xiaoyuzhoufm.com

4月是大模型频频迭代的一个月,也是中国大模型的集中发布期。这些模型更新迭代之后到底进化在哪儿,可能深度使用者最有发言权。本期嘉宾和他的团队也在过往的使用体验中,结合一些学术论文研究出了一套给大模型打分的标准——如果不是一个专业的技术人员,普通人也可以通过一些好玩的测试题目,区分国产大模型与GPT4到底有哪些不同。

随着越来越多的大公司与创业公司加入到国产大模型的竞争中,本期节目我们也聊了聊,除了芯片困境,国产大模型到底怎么样,以及难在哪儿?


【主播】
泓君,资深媒体人
【嘉宾】
戴雨森,真格基金管理合伙人


【你将听到】
使用体验
【03:18】大模型的使用体验:与七八年前的对话机器人很不一样
【04:51】ChatGPT 20问游戏:理解规则+二分法查找
【05:51】Midjourney:从V3到V5进化惊人,打开新的使用方式
【08:48】手工更贵,机器做的更好:原创会越来越有价值
【10:05】如何使用ChatGPT:更适合脑洞与头脑风暴
评分系统
【12:21】300个问题,如何设计出一套大模型的评分系统
【15:22】GPT4评分80分,国产模型迅速从20分追到50分
【16:43】麻辣螺丝钉与爆炒篮球,GPT的进化速度
【20:05】两个月飞速进展:从聊天机器人到GPT4到AutoGPT
【21:46】大模型也有类似于自动驾驶的五级分类
【24:10】基于大模型的创业,早创业还是晚创业谁更有优势?
国产大模型
【29:12】国产大模型格局未定,但要先造船
【32:13】大模型的终局是什么:赢家通吃?类公有云格局or百家争鸣?
【34:50】不止是A100芯片,数据、算法、架构,都需要解决
【36:59】中文互联网的数据不是问题?
【38:33】AutoGPT初印象:既震撼又忧虑
【40:43】微软可以一天训练一个GPT3,但只有它的超算才能训练GPT-4
【44:01】GPT的价值观:目前还是加州白人男性价值观
【46:38】潜在安全风险:操作选举,电话杀猪盘,垃圾信息
【49:04】OpenAI的股权结构:收益权与控制权分开
【53:00】做出OpenAI需要探索能力,第二个做更需要执行能力
【54:54】这轮AI浪潮有泡沫也有啤酒,人类最大的一轮技术革命
【57:04】未来不可预测,我所说的都是错的
【59:04】技术成熟有利于成熟创业者,新技术反而利好年轻人


【招聘】
我们团队目前正在招聘全职的播客节目监制、视频后期、商务拓展以及运营,欢迎感兴趣的小伙伴把你们的简历和代表作品发送到我们的邮箱:[email protected]。具体要求我们之后会发布在【硅谷101】的微信公众账号上,欢迎关注。


【相关资料】
真格基金的评分系统:大模型测试集Z-Bench
https://mp.weixin.qq.com/s/D9xQYIw8K2OjVLBwzNtagQ


【BGM】
Cheese and Crackers
【后期】
AMEI


【在这里找到我们】
公众账号:硅谷101
收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客
海外用户:Apple Podcast|Spotify|TuneIn|Google Podcast|Amazon Music
联系我们:[email protected]

Special Guest: 戴雨森.

主播...
泓君Jane
评价...

空空如也

小宇宙热门评论...
LiamZ
1年前 荷兰
0
26:39 不一定要第一个做,但一定要成为第一批做的人,先做的人,会积累各种经验和资源。
昱涵不御寒
1年前 上海
0
1和0的区别很大,受教了。
liveM数字朋克
1年前 广东
0
40:30 “现在微软每天可以训练一个 GPT3”🚀
励志小吴💕
1年前 北京
0
58:49 很鼓励我投身ai😭
宅心人瘦
1年前 江西
0
棒棒
Tiki-G
1年前 广东
0
15:28 商汤是哪个
盛放
1年前 黑龙江
0
超级棒的一篇
阿互
1年前 北京
0
14:14 体验了国内的文字类模型,文心一言的结果不太让人满意,讯飞星火结果挺棒的。
HD856136z
1年前 上海
0
13:19 讲的太浅了,能不能请行业专业人士来讲讲。
Cosmoz
1年前 广东
1
哈哈哈快听完了才发现嘉宾是戴总,很熟的一个教授朋友是戴总在清华的室友😂
RoyZ
1年前 上海
1
10:00 但是原创有用嘛?AI看一眼就马上能复制成99%相似的东西出来,最后会不会原创者都被当成良币被驱逐掉了呢……
Jowin
1年前 广东
1
58:06 57:58 80后赶上互联网,00后赶上AGI,那90后呢🙊
展Zhan
1年前 上海
2
结尾最大的收获:别急,玩家可能还没登场
KIDNAPENIAC
1年前 未知
2
今天早上的惊喜就是硅谷101有新的一期了!
OASIS_9bKs
1年前 广东
3
作为一个AI画图爱好者,我觉得MJ只要还是通过stablediffusion作为底层模型,那么可以说他的技术护城河并没有想象的那么高,只要有够丰富的微调经验应该是能够做到MJ差不多的效果的。但是SD的优势,比如说lora模型和controlnet我觉得是midjourney不能比拟的,而且目前的模型微调训练比如dreambooth已经没有什么门槛了。整体而言,我觉得未来AI图片生成方面应该是以提供充足的算力,更友好的用户界面,更有效的模型交互方式作为核心竞争力。而把模型训练这些方面放给用户来做,这样能够更加容易满足多元化的需求(当然目前的模型微调易用性还不好,要求你有一定的相关基础),像MJ这种,“只写prompt,剩下的交给我”,在目前AI图片生成竞争还不算非常激烈的情况下是占有优势的,但是往后却是不能保证竞争力能够维持的。
Futureman2050
1年前 云南
4
00:02 #ChatGPT#OpenAI#NewBing#Microsoft#中国人工智能#创业#困境#模仿的错误 ​ ​引用朋友 #颉华 的观点,国内从事人工智能或者投资的,没有弄明白的几个关键而又基本的逻辑点(我思考和关注点) ​ ​(1/)拿不到的内容分为几部分:芯片,主要是涉及算力问题,被禁售的芯片,不仅仅是提高算力,而是提供算力,以现有的计算能力,根本无法做到模型参数的高效更新 (2/)拿不到的内容分为几部分:训练用数据集,咱们本身拥有的数据集规模不小,但是数据质量呢?基于“大家懂,我说了,号就没了”原则,咱们自己很清楚我们拥有的数据集质量 (3/)拿不到的内容分为几部分:核心模型,GPT的升级,不是简单的算法升级,GPT一直在升级自己的参数,包括输入参数,以及参数衍生的参数,这些参数如何更新,如何优化,这玩意,GPT已经作为很核心的内容,保护起来了 #MSFT 推出的new Bing里面,已经在使用了 我们是拿不到的 不要告诉我,我们可以通过不断测试的方式获得“次优解”,不可能的,因为这些参数的耦合关系不是线性的,用测试的方式获得规则,简直就是痴人说梦
墨菲躲不过
1年前 上海
4
31:43 哥伦布发现新大陆这个比喻真得很形象啊
鳄鱼怕怕
1年前 浙江
23
22:25 类比自动驾驶,嘉宾 yusen 对 AI 的五个级别划分 L1 : AI 没有做任何事情 L2 : AI 给信息,人做事情——比如问 AI 问题,AI给信息,人来做事情,类似chatGPT L3 : 人和ai都要做事情(copilot)——如 github copilot、midjourney 等。人和 AI 各自50%对50%;人给出Prompt,改Prompt。AI完成初稿,人在初稿的基础上改进 L4 : AI 做大部分的工作,人做决定和监督——AI 自如完成选择工具&分解任务的过程;人给出目标,人监督完成的过程,检查完成的结果是否满足要求,检查接口和计算能力的资源等。如 autoGPT L5 : 人只给目标。AI 做所有的事情并延续下去。如「冯诺依曼机器人」
TimChen
1年前 美国
29
部分takeaway如下: - 雨森使用AIGC工具的经验 - ChatGPT发布第二天使用就被惊艳到了,最震撼的是玩20问的游戏,见识到了ChatGPT能理解规则且有效利用二分法高效查找。 - 从2022年8月就开始使用Midjourney,到现在画了几千张,明确感受到了V4版本对于人物的优化,V5在很多细节和场景的真实度加强了很多;并且Midjourney最近发布了很重要的功能Describe,可以根据用户上传的图片生成几个可能的prompt,这个功能极大帮助到了用户创作。用户可以有效将一个构图不错的内容换一换建筑物。这也导致了游戏行业原画领域砍掉了很多美术。 - 雨森觉得ChatGPT哪里做得好? - 语言相关包括自然语言和编程语言:很多人都用co pilot写代码,翻译、总结、改写、扩写的任务完成度都很高。 - 头脑风暴型任务:利用ChatGPT进行概括,列出来五个关键点灯类型任务。 - 真格在评估大模型做了哪些事情? - 做出了一套评估模型大概300个问题,目前已经对外公布,但是还有很多暗题避免作弊。 - 比如,如何做麻辣螺丝刀?除了GPT4会告诉你不能吃螺丝钉,其他的大模型都胡编乱造一个菜谱。 - GPT3.5可以答对60题左右,GPT4可以答对70题,国内大部分创业公司是20-30分,商汤做到了50分。 - 对于创业公司来说,从20追到50很容易,但是50-80会很有挑战。 - 过去两个月大模型有哪些进展? - 最开始的Chatbot本身已经很惊艳,但只相当于自动驾驶的L2。 - 第二阶段像Co-pilot, 协助人类完成一些工作,差不多是L3。 - 第三阶段像AutoGPT这样的产品会是接下来的趋势:识别一个大任务,分别拆成子任务,调动工具完成子任务,观察自己完成的结果,对结果进行反思,调整要做的任务。这个阶段相当于自动驾驶的L4。 - L5是什么呢?人给一个目标,AI也不需要监督就可以自主做完所有任务,冯诺依曼提出过类似的概念。 - 从创业的角度来说,晚做会不会比早做更有优势?比如晚做可能直接GPT4而不是3.5了 - 这是一个假设,很有可能3.5到4就是改一个api key的区别;而且从历史来看,科技领域先发优势还是占多数的。 - 对于早期创业来说,踩过坑非常重要,早期经验的差别是0和1,中后期可能是9和10。比如张小龙当年做微信的优势来源于QQ自己的技术积累,而米聊没有踩过这些坑就输了。 - 什么情况会有后发优势呢? - 之前不知道能做出来,且花N人N钱就可以搞出来,那就很有可能很快追上了,也就是当前国产大模型的现状。当大家知道新大陆就在西边,并且一艘大船和2个月的食物就能到的时候,这些确定性信息就会显著缩减后发者的追赶时间。 - 国产大模型现在的情况是什么样呢? - 因为现在没有一个国产的类似于ChatGPT的大模型,所以大家都在做这件事情。而美国已经不再有新的独立做大模型的公司了。以后的格局也会是三四家各有特点的大模型分割市场,可能一家擅长图像,一家擅长推理。 - 国内芯片短缺的问题是否会导致越落越远的战局? - 是否大模型真的是百公里长跑?也可能现有算力就够了。 - 随着训练效率和方式方法提高,对芯片的需求会降低。 - 国内半导体工业还在发展,同时也寄希望于中美关系缓和。 - GPT3其实只是在一万块v100训练的,基础大模型对于芯片的需求可能被高估。但是,GPT4是在一台Azure为OpenAI定制的超算训练而成的。 - Yusen对于OpenAI的评价 - 虽然一开始是一家研究机构,但是很有PM的思维。GPT4发布的时候已经经过了几个月的合规训练,并且也没有着急发布text to picture/video的功能。如果单纯从研究机构考虑的话,OpenAI会很有动力抢头彩。 - 合规安全仍然是非常大的挑战,如果坏人利用GPT4干预大选,调用所有的语言学、心理学、逻辑的技巧去说服选民,很有可能美国总统就变了。 - 股权设置很有意思,Sam Altman是没有任何股权的,盈利主要分给了科学家。作为股东,只能从财务回报和投票权二选一。Sam选择了不要钱,要投票权。 - Yusen给年轻人的建议 - AI与前几轮的Web3 元宇宙浪潮不一样,AI就有直接的实际应用场景,提高生产力。 - 技术革命预测未来基本不准,2010年移动互联网开端很难想象到2023年字节、拼多多、小红书等公司。 - 技术革命的早期要尽早上船,技术比较成熟的时候有利于连续创业者,但技术比较新的时候有益于年轻人,保持冲劲,多用多探索。
零零ling
1年前 广东
30
我是某大厂游戏从业者,MJ重度用户。可以负责任的说,行业内很多人会把MJ当做创意发散的工具,SD是细化的工具。人类在这个过程中反而是修修改改复制粘贴的那个。“成为会用AGI的人”,这很重要。
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧