简介...
https://xiaoyuzhoufm.com

月之暗面 Moonshot AI 是一家神秘且特别的大模型创业公司。


公司目前只发布了一款产品,基于千亿大模型的 chatbot 产品 Kimi Chat。发布之初,就打出了「长文本」、「自研闭源」、「toC」等清晰的标签。


创始人杨植麟饱受期待,他毕业于 CMU,师从苹果 AI 负责人 Ruslan Salakhutdinov,曾在 Meta 和 Google Brain 任职,是 Transformer-XL 与 XLNet 等爆款论文的第一作者。被多家头部 VC 寄予厚望,他本人对于大模型技术发展、行业未来将如何演变等话题也有着独特的见解。


时间轴:


00:04:20 月之暗面名字的由来


00:09:06 当初为什么投身做大模型?


00:17:43 OpenAI是通向AGI的好的组织样板吗?


00:23:46 组织形式不同,带来的涌现也不同


00:28:46 大模型的技术路线可能确定,但实现方式仍是未知的


00:33:35 为什么选择长文本作为突破?


00:39:20 如何看待大模型的开源和闭源?


00:03:52 为什么大模型创业这么坚定 toC 的路线?


00:45:53 如何定义AGI时代的super-app?


00:49:40 AI Native的super-app 开发范式会如何变化?


01:03:05 AGI时代需要怎样的产品经理?


01:13:05 开源能力也不错,为什么月之暗面要端到端的做应用?


01:16:23 AGI时代的「场景摩尔定律」


相关阅读:


月之暗面杨植麟:大模型需要新的组织范式,场景摩尔定律能催生 Super App


关于我们


这里是极客公园旗下的科技创业者社区FounderPark出品的AGI 系列播客节目「AI局内人」,围绕 AGI 相关领域的技术发展、产品方向以及新的商业模式进行探讨和交流。


Founder Park 正在搭建AI Native 的产品交流群,群内聚集着致力于在大模型相关领域创业的创业者、产品经理、研发工程师、对大模型技术和场景应用开发进展感兴趣的学者及投资人。


扫码添加社群助手,拉你进群:



主播...
评价...

空空如也

小宇宙热门评论...
张宝_2024
1年前 安徽
15
杨总思路清晰,每个问题回答得恰到好处,给主持人和听众的体验都很好。 作为一个面向大众市场的C端免费产品,kimi运营人员在社群认真回答每个群内用户的问题。还没有看到其他类似的产品有这样的做法。
JASting
1年前 北京
11
54:19 新的开发范式是前端变成语言UI,后端变成大语言模型。这两端已经确定,所以今天的创业机会主要在于前端和后端之间,即数据。新的范式是“用数据来定义产品”。对应产品经理职责变成定义两个数据集开发产品,一个训练数据一个测试数据。训练数据决定模型能力,测试数据决定研发团队考核。
桑尼尼尼
1年前 上海
6
嘉宾的录音质量不是很好诶……要是可以升级下录音设备就更好啦
RAMEET
1年前 广东
5
听了几遍
SinSin
1年前 北京
2
1、AGI的涌现依赖强大的技术能力与组织,组织往往是被人忽视的; 2、移动互联网时代,产品是被人设计出来的;而AGI则是,当它被做出来的时候,它就被设计好了。“人”的神性与系统性相比,系统性会逐渐碾压“神性” 3、Open AI时代人应当是个可变的容器,快速迭代自己是最重要的 4、必然会有新的Super App产生
JASting
1年前 北京
2
09:45 一直投入训练基于transformer的语言模型的原因,是相信:所有问题都可以通过把语言模型(next token prediction)做的更好就可以解决了。 训练的方式就是:不断投入,不断scale,不断找更高效方式scale,就可以找到更好的解决问题的方法。无论是记忆推理or多链路的复杂问题。
JASting
1年前 北京
2
50:55 产品开发方式会随着底层技术变化而变化。移动互联网是确定性的需求(按什么按钮弹什么弹窗),对应是旧的计算机技术:hardcoding/确定性的编码(与或非逻辑运算),衍生出确定性的交互(graphic UI)。新的开发方式变化:一是前端变成语言的UI,二是后端变成语言模型。上一代是对世界上所有信息做编码,这一代是对世界上所有信息做建模/无损压缩。
Fazzie
1年前 上海
1
kimi!
iam2fei
1年前 北京
1
kimi chat 是真不错
Jax_
1年前 上海
1
我觉得这是个很好的问题
鲜世丹
1年前 广东
1
17:35 未来只有一个 AGI 组织,还是有很多 AGI 组织?未来是只有一种 AGI 还是很多种 AGI ?
昭蘅liz
1年前 上海
1
53:10 “上个时代是对所有信息进行编码,这个时代是对所有信息进行无损建模。”
JASting
1年前 北京
1
50:59 mark:开发范式定义
瓦尓特
1年前 河北
1
45:49 通往AGI需要大量高质量数据,那就需要大量用户
JoLeung
1年前 荷兰
1
38:30 为什么选择长文本能力作为自己的speciality? 1. 长记忆才能产生情感依赖; 2. 类比操作系统,长文本能力是内存,rag是外存
JASting
1年前 北京
0
36:01 transformer是新的计算机,1个维度是参数量,决定了计算复杂度;1个维度是上下文长度,决定了内存。
周郎弗顾曲
1年前 北京
0
04:22 阿里不是四个字儿吗😂😂
虚伪的海之花火
1年前 北京
0
值得反复听!
轿子特稳
9个月前 广东
0
场景摩尔定律会不会存在呢?会不会和industry vertical类似呢
冰淇淋酵母
8个月前 未知
0
18:35 为什么agi下的需求是无法规划的?即使没有数据,应该有定性的方法辅助规划吧
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧