在虎嗅 F&M 创新节的特别策划——F&M不停播中,播客【科技早知道】主播丁教Diane与彩云科技CEO袁行远共同探讨了人工智能大模型和 AI 应用的未来。
据媒体报道,OpenAI、Google 和 Anthropic 等科技公司的最新大模型训练表现均不及预期。在通往 AGI 的路上, scaling law 是否已经见顶成为大家讨论的话题。在算力和数据遭遇瓶颈的当下,如何让大模型的效率更高,用最少的算力和参数实现模型的提升成为亟待解决的问题。
就在 11 月,来自国内的人工智能企业彩云科技发布了他们自研的 DCFormer 架构及基于该架构的通用大模型。除了自研大模型,彩云科技还有三款自己的 AI 应用 -- 彩云天气、彩云小译和彩云小梦,并且实现了商业化。
为什么一家创业公司要选择研发自己的底层大模型?人工智能时代需要怎样的应用? AI 产品的商业化要怎么做?来听听他们在 F&M 创新节上的独家分享。
本期人物
丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播
袁行远, 彩云科技 CEO
主要话题
01:42 彩云不是一家只做应用公司,还是一家做模型的公司
04:33 搞清 transformer 黑盒子的运行机制,实现 1.7 ~ 2 倍的模型效率提升
09:57 缺钱、缺数据、缺算力,创业公司靠什么做出优质的大模型?
12:42 Scaling law 见顶? 除了卷数据和算力,还有一条路是模型优化
17:49 从 AI 翻译到彩云小梦,生成式 AI 非常适合故事创作
22:39 算力等价原理:人类大脑创作「三体」需要十年, AI 创作伟大的作品也需要同样的算力和时间
26:44 消费性不够,留存率不足,现阶段 AI 造梦师只能让 bubble 持续半小时
32:07 未来的 AI 创作:随时进入任意时空和宇宙,生命得到极大延展
幕后制作
本期节目由【科技早知道】团队制作
监制:Yaxian
后期:Jack
运营:George
设计:饭团
空空如也
暂无小宇宙热门评论