Album
时长:
26分钟
播放:
101
发布:
2年前
简介...
https://xiaoyuzhoufm.com
AIGC创业者和投资人应该优先考虑解决实际问题和满足用户需求,而不是纯粹追寻技术,“拿着锤子找钉子”。
| 嘉宾 |
杜雨 《AIGC:智能创作时代》《WEB3.0:赋能数字经济新时代》作者、科技创业加速器QAQ创始人
| 内容 |
绝招:“好诗不过尽人情”
复旦金融评论:近期关于ChatGPT的许多讨论都是围绕AIGC产品能做什么、是否会在不久的将来取代人类的工作、如何重新思考教育方式这类问题。因为您的教育背景是经济学,也曾在红杉资本从事过风险投资,我们非常期待和您探讨AIGC产品商业应用和投资前景相关的话题。
虽然底层的技术应用有所不同,但与微软Bing这类聊天机器人相比,ChatGPT算是后来者。它之所以名声大噪,是否是因为大语言模型对于2C用户这样的交互场景更让人感觉亲切友好?如果各家科技巨头的技术水平都相当,或者相比OpenAI更胜一筹,那为什么是ChatGPT首先引爆市场呢?
杜雨:过去这么多年,人工智能发生了巨大的变化。当我们最初关注人工智能时,我们可能是在利用它承担安防和人脸识别等任务,这也是国内AI“四小龙”公司的主要领域。我们可以将这个时期称为AI1.0时代。这个时期主要使用决策式、专用性AI,我们更多地使用它来完成一些特定的任务,让它来做判断题,例如人脸识别。但我们无法让它很好地完成开放性更强的一些任务,这是AI1.0时代的局限性。
我认为ChatGPT之所以能够大火,原因之一是从决策式、专业性的AI向生成式、通用性AI发展。这其实包含了两个趋势,第一个趋势是从决策到生成,另一个趋势则是从专用性向通用性发展了。相较于微软小冰和Siri,如今的ChatGPT更加让人震撼就是因为它能非常好地完成各种开放式的生成类任务,并且应用的场景也更加通用了。
以前,我们或许已经可以让微软小冰写诗,但是“小冰写诗”的程序也只能用于写诗。但今天的ChatGPT很聪明,它可以在对话中灵活地满足你的各种需求,就拿写诗来说,或许就在聊天时你和它说“我在夕阳西下的河边欣赏到美景”,ChatGPT或许就会在对话中说出“落霞与孤鹜齐飞,秋水共长天一色”这样的句子,或者它自己创作出句子,也就更接近真人了。它已从一个非常机械式的专科生变成了一个有情商、有温度的硕士生。我认为这在技术层面上是最大的突破。
除了技术原因之外,我认为还有一个更重要的原因——在ChatGPT这种聊天式的产品模式下,每个用户都可以与其交互,门槛低且通用。考虑到大多数用户在互联网上主要使用文字进行交互,比如微信上的互动仍然以打字的方式进行。因此,我认为ChatGPT的场景正是大多数互联网用户最为熟悉的。
实际上,绘画比ChatGPT更早进入市场,但我观察到当时虽然也引起了一定的媒体轰动,但好像热度远远不及这次ChatGPT。其实早在ChatGPT出来之前,OpenAI就曾经推出过另外一款图像领域的AIGC应用DALL·E2。海外还有一个名为MidJourney的AI绘画工具,用它生成的一副油画美国科罗拉多州博览会的艺术比赛中获得了冠军。
总的来说,ChatGPT火爆的第一个原因是由于AI技术的快速发展,使其通用性更强。而第二个原因则更为重要,因为它将文字聊天的场景带给了每一个使用者,而这要比我们之前的作画场景更加贴近人们的日常生活。
复旦金融评论:AIGC备受关注的时间点是2022年年末ChatGPT发布的时候,是否可以看作是AI或者更精确地说是AIGC到达了发展的拐点?其他科技巨头没有像ChatGPT一样开放2C产品,是不是出于监管、隐私、版权、道德等方面的顾虑呢?
杜雨:虽然看起来ChatGPT是在2022年末突然引爆,但其实这也是一个台上一分钟、台下十年功的结果。实际上,我们注意到OpenAI是在2015年成立的,而且它的创始团队非常豪华。虽然它是一家创业公司,但我们可以看到无论是山姆·阿尔特曼(Sam Altman),还是我们非常熟悉的埃隆·马斯克(Elon Musk),他们都带着非常强大的影响力、资金和资源。因此,我认为这家公司的许多年积累主要体现在其技术层面上。在科技界,我们一直在关注它。ChatGPT也只是这家公司的冰山一角。在其他模式下,包括其大型模型参数的积累仍在不断提高。
我记得GPT系列模型第一次对外公开应该是在2018年。在GPT-1时,它的参数量级只有1.75亿。后来到了GPT-2和GPT-3,GPT-3的参数规模接近2,000亿。有人预测,到了GPT-4的时候,模型的参数可能会达到百万亿级别,这意味着它与人脑的神经元突触的量级相当。
因此,我认为2022年是一个合适的时间点。一方面,这是由于底层模型的能力出现了巨大的突破。另一方面,随着参数规模和训练语料的规模达到一定的拐点,该模型确实可能变得适合公众使用。虽然在更早的时候不少程序已经使用了底层的模型,但可能会在现实的应用角度出现各种各样的阻碍。而这项技术目前确实已经发展到了一个重要的拐点。
另一个我认为更重要的原因是,OpenAI最初是一个非营利组织,尽管它现在是一个有限盈利的商业组织,但我认为它在推动通用人工智能的发展过程中,认识到了集思广益的效用。因此,也许需要发布一些能够让消费者感受到里程碑式的产品来引爆全球的关注度。
像DeepMind、OpenAI在内的一些致力于通用人工智能发展的公司在刚成立时,都在传统的AI界引起了争议。当时,很多AI领域的大牛认为这条路走不通。还不到10年的时间,通用人工智能就已经给大众市场带来了一个非常有意思的产品,对于整个行业的意义重大。
所有创新技术需要经历的过程,从备受争议到开始有一些苗头,再到大家对它有信心,更多的人才、资金和消费者涌入。ChatGPT在2022年底的火爆之后,或许会让许多孩子在心中埋下对人工智能的种子,或许也会让许多正在读大学选专业或即将读研的计算机系学生更愿意选择通用人工智能这一研究方向。对于像我们这样的投资人,国内已经有好几家大模型公司,现在都是各大美元基金的香饽饽,大家都在争先恐后地想要参与其中。更期待的是或许到2033年,人工智能能够成为一项非常通用、在人们日常生活中渗透率非常高的技术。
复旦金融评论:初创公司可能会尝试在AIGC方面用图形处理方面进行研发。您提到在文本处理之后,视频处理将会迎来爆发。您觉得AIGC技术对哪类载体的信息处理更有潜力?多模态的信息处理会不会相互转化?
杜雨:跨模态的应用现在已经非常普遍了。比如我之前提到的一些早于ChatGPT的AI绘画公司,例如Stable Diffusion、DALL·E2、MidJourney。实际上,它们本质上都是跨模态的产品,因为当你与机器交互时,更多的会提供一个文本指令。比如我要求机器画一幅向日葵,实际上只需提供文本,然后机器就会呈现图像,这本身就是一个跨模态的应用。你也可以给机器一张图片,它会理解图片后作诗,这个比ChatGPT更早出现。但像文字跨图片这种跨模态的应用似乎在当下并不如ChatGPT一样受欢迎。
我认为离消费者日常需求更近的模态一定是最有潜力的,但这个答案不是固定不变的。例如,在PC互联网时代,由于带宽和输入设备的限制,图文是最主流的内容形态。但随着移动互联网时代,抖音、快手等应用崛起,短视频开始占据用户越来越多的时间。所以我认为,在未来两三年,短视频可能接棒文字成为下一个超越ChatGPT在AIGC领域更具潜力的内容形态。如果将时间拉得更长一些,比如到2033年或者更远,元宇宙或沉浸式世界有可能成为下一个超越ChatGPT在AIGC领域的产品。
应用:将至已至,唯变不变
复旦金融评论:在很多的专业细分领域,比如金融、医疗、艺术,AIGC的应用能够更高效地辅助并且替代人类的某些职能。如何理解AIGC的专业运用和它通用性的特点?
杜雨:实际上,通用人工智能更像我们日常使用的工具,就像电脑一样通用。实际上,专用性AI替代的是特别专、特别精的岗位,以及那些需要重复性劳动但不需要高复杂度的工作。而这一次,通用式人工智能所带来的生成式AI的优势在于它的综合性。
目前这一波大模型训练出的智能机器人类似于大公司的管培生,更加具有通用性,解决的是任何行业都可能遇到的一些共性问题。因此,它的覆盖面很广,更像是综合大学毕业的学生,不止会做图表,而会根据当前情况的变化实时调整它的反馈。
走向通用化的AIGC技术其实与今天整个世界的变化趋势是非常吻合的。如今的综合性大学和我们儿童时期所接受的素质教育本质上都旨在培养适应世界变化的综合能力。因为世界变化更快了,所谓的专业性已经成为临时性概念,无论是对于岗位还是人才。也许你正在思考某个问题,科技有了突破、人们对自然界的认知有了突破,过去使用的方法可能不再高效。随着世界变化的加速,通用人工智能甚至是通用型人才都变得越来越重要。
复旦金融评论:如果说拥抱AIGC是必然的趋势,那么企业和个人为了提升竞争力,要驾驭人工智能的能力是否需要投入更多的时间和经济成本来应用这项技术?
杜雨:其实我认为是投入更少的时间。我们要知道,今天AI发展的本质是让机器听懂人话。如果我们要培养出一个写代码特别厉害的学生,他需要完成四年的本科教育;要深耕这个领域还需要继续攻读硕士或博士,但这个人才培养的过程没有可复制性。
工程师需要做的事情是帮助人类进行翻译和转译,他们既需要理解机器语言和原理,需要理解人类语言。而AI的发展正在弥合人类和机器之间的语言鸿沟。随着AI技术的进一步发展和普及,未来人类和机器之间的沟通会变得更简单。每个人都可以轻松地与机器对话。就像我们今天使用ChatGPT一样,它可以帮助我们编写代码。有时候,我们不是为了编写代码而编写代码,比如在学术研究中经常需要使用爬虫。但并不是每个人都学过Python。而今天,你只需要告诉ChatGPT研究的问题和要爬的数,它就可以为你编写一个基础语句,只需要在此基础上微调就可以用了。因此,随着AIGC软件的应用,每个人学习机器语言和如何与机器互动的时间将会缩短。
……
E002. 对话杜雨:ChatGPT热潮下的创投冷思考(下)用户第一还是技术优先
* 策划/采访:潘 琦
* 制作/运营:葛雯瑄
* 收听方式:您可以通过苹果播客、喜马拉雅、小宇宙、网易云音乐、QQ音乐等平台收听节目。
* 联系我们:FFReview2018(微信)
欢迎添加小助手微信FFReview2018,加入听友群,第一时间收获经济热点轻解读、在线金融大师课。为了营造更好的讨论环境,我们准备了两个小问题,请在添加小助手后回答:1. 关于金融方面,您最喜欢/推荐的一本书?2. 您希望听到《财经相对论》聊哪些话题?本期节目,我们将在评论区主观选取1位听友,赠送由中译出版社出版的《AIGC:智能创作时代》一本。
期待与您交流!
评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧