31. 中美大模型差距过去一年变大还是缩小?- Hugging Face | 王铁震
苔藓之火

31. 中美大模型差距过去一年变大还是缩小?- Hugging Face | 王铁震

65分钟 2.85万 1周前
节目简介
来源:小宇宙
也许14亿人的数据飞轮会成为下一轮大战的燃料储备,推荐算法也不是字节开始的,但抖音才是集大成者。
视频播客 📺B站链接 / 📕小红书链接 / ▶️YouTube链接(逐字稿在小红书)
嘉宾:前Hugging Face APAC Ecosystem Head | 王铁震 Linkedin联络方式
免责申明:本节目的所有内容都并非旨在提供任何形式的建议,包括但不限于投资、税收、会计或法律上的任何建议。
互动环节:
1)参与投票,你觉得未来一年差距变大还是缩小?
2)你使用AI有什么想吐槽的?
Shownotes:
01:50 为什么用脚投票,体感上美国模型还是远远领先?
03:30 中国大模型跨过可用这条线吗?
07:16 从惊艳到理所当然,用户的衰减曲线有多快?
09:28 DeepSeek V4发布,为什么没像年初那样炸裂?
10:17 被忽视的实力:DeepSeek如何通过KV Cache把成本打到地板?
13:20 适配国产卡,为何是世界级难题?
17:15 美国怎么看中国模型?
21:38 中国模型爱刷榜?
29:19 数据壁垒越来越高,中美模型差距会因此越拉越大吗?
30:40 14亿人的数据飞轮会带来什么?(致歉:录制中间出现口误说了12亿几次)
35:24 HuggingFace热知识:中国模型的全球下载量被低估
36:49 美国人用中国开源模型的三个阶段:抗拒、接受、离不开
41:15 Mistral在欧洲还好吗?
43:05 2026年,疯狂开源的浪潮会退去?赚钱才是硬道理
45:27 哈萨比斯说中国差在心态,是傲慢还是事实?
50:30 如何考虑AI的效用与向善
59:16 AI能自己迭代自己,一个新物种正在诞生吗?
01:02:39 AI时代怎样养小孩?
关键词
中美大模型 差距 DeepSeek 数据飞轮 开源 闭源 千问 Claude 豆包 算力封锁 国产卡 KV Cache 数据飞轮 刷榜 AI伦理 养娃
小宇宙热评
史地文
1周前 北京
20
这么好的播客才一万
Geisterfahre
5天前 上海
19
好用的是claude code的前端。 在claude code上用kimi和deepseek,会比直接用kimi和deepseek好用很多。 所以主观上模型的差距并不大,而是背后的prompt,架构上的优化方面,claude code非常强。
AaronZ_RprY
6天前 浙江
14
42:42 所以主持人是完全不懂技术是吗…
一粒小小麦子
5天前 四川
12
感觉主持人自己话有点过多了。建议主持人以后自己少说点,多一点有价值的问题。
白色的蓝
1周前 北京
8
这期很好, Raymond 问的问题很好,很犀利;嘉宾铁震行业和技术很扎实👍🏼
晨煊-
1周前 北京
7
张小珺播客最新一期嘉宾其实提到了圈内人大多心照不宣,国内的模型大多是靠蒸馏美国的,只不过通常“软蒸”属于灰色地带,也有其存在即合理之处,其他个别那些“硬蒸”的就纯属偷了,看评论,貌似那家已上市的公司就是“硬蒸”的。所以当宣传追上了,训练成本低时,都实际有另一个故事……https://www.xiaoyuzhoufm.com/episode/6a00aa051b7bd50295dfe41d
HD667885y
1周前 江苏
7
朴实无华,我也觉得一旦中国大模型抵达opus4.6的可用程度,就能翻盘一切了。这个能力和高可用性能做太多事情。
Shoriscool
1周前 北京
6
感谢这个播客,很精彩!不仅仅是谈技术细节上的趋势,也照顾到了商业化,tech for good,but如今的ai在产业界变成了裁员的工具。与此同时从业者一个个的又十分焦虑。小到模型的发展大到社会的进步,我们每个人身处一场革命之中。到底谁会成为那个拿着ai这把锋利刀的人?ta会有良心吗?
JZB
5天前 上海
5
DS的低成本才是未来,只要后续跨过可用线就赢了
HD500838v
1周前 山东
5
反复尝鲜者表示codex>claude>kimi2.6>deepseek>glm>>minimax
刘春龙_dI7U
1周前 四川
4
我准备写一篇文章,呼吁大家用deepseek的api。让deepseek的数据飞轮转起来,让deepseek更有钱! 别再帮美国模型了。我实测,deepseek v4已经完全可以平替sonet4.6,只是偶尔会做点出格的事情。就像一个调皮的小孩一样。但是这个小孩是我们自己的,我不能说你调皮,我不爱你了,我去看美国小孩吧。我觉得应该多用,多反馈,deepseek就能越快变更好。
Emilian
1周前 湖南
4
首页推荐来的,意外是很好的内容,干货很多,没有废话,信息密度很好,主持人很会问问题。感觉大家用模型的方式都好高级,我现在还在使用对话框聊天的阶段(汗颜)
时间里的飞人_ZfHs
1周前 河南
3
全程没有废话,全是干货!
不空_ZgUf
5天前 上海
2
我觉得大多数人还是不会用,模型要提供足够的上下文,做足够的评估,对自己的作业做好优化,才能用好,不能老想着一把过,这样会越用越累。
小天狼星111
5天前 浙江
2
嘉宾不错,有逻辑,有想法,三观正
Sugarzh
5天前 江苏
2
这语速这信息密度,大赞
lee123321
1周前 广东
2
主播说Codex不可用?你已经out了!
JimJin
3天前 北京
2
主页推送,嘉宾很赞,主持人如果技术不是很懂,希望对技术多些敬畏之心
xinbabay
1周前 北京
1
想听AI时代怎么养小孩的专场😁
陌生ZZx
1周前 上海
1
大模型推理适配国产卡很简单,苹果macmini都能推理。真正是后训练这些地方考验国产卡

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧