31. 中美大模型差距过去一年变大还是缩小？- Hugging Face | 王铁震

65分钟 3.65万 1个月前

主播

节目简介

来源：小宇宙

也许14亿人的数据飞轮会成为下一轮大战的燃料储备，推荐算法也不是字节开始的，但抖音才是集大成者。
完整无删节版本请看视频播客 ▶️YouTube链接
嘉宾：前Hugging Face APAC Ecosystem Head | 王铁震 Linkedin联络方式
免责申明：本节目的所有内容都并非旨在提供任何形式的建议，包括但不限于投资、税收、会计或法律上的任何建议。
互动环节：
1）参与投票，你觉得未来一年差距变大还是缩小？
2）你使用AI有什么想吐槽的？
Shownotes:
01:50 为什么用脚投票，体感上美国模型还是远远领先？
03:30 中国大模型跨过可用这条线吗？
07:16 从惊艳到理所当然，用户的衰减曲线有多快？
09:28 DeepSeek V4发布，为什么没像年初那样炸裂？
10:17 被忽视的实力：DeepSeek如何通过KV Cache把成本打到地板？
13:20 适配国产卡，为何是世界级难题？
17:15 美国怎么看中国模型？
21:38 中国模型爱刷榜？
29:19 数据壁垒越来越高，中美模型差距会因此越拉越大吗？
30:40 14亿人的数据飞轮会带来什么？（致歉：录制中间出现口误说了12亿几次）
35:24 HuggingFace热知识：中国模型的全球下载量被低估
36:49 美国人用中国开源模型的三个阶段：抗拒、接受、离不开
41:15 Mistral在欧洲还好吗？
43:05 2026年，疯狂开源的浪潮会退去？赚钱才是硬道理
45:27 哈萨比斯说中国差在心态，是傲慢还是事实？
50:30 如何考虑AI的效用与向善
59:16 AI能自己迭代自己，一个新物种正在诞生吗？
01:02:39 AI时代怎样养小孩？
关键词
中美大模型差距 DeepSeek 数据飞轮开源闭源千问 Claude 豆包算力封锁国产卡 KV Cache 数据飞轮刷榜 AI伦理养娃

小宇宙热评

史地文

1个月前北京

这么好的播客才一万

Geisterfahre

1个月前上海

好用的是claude code的前端。在claude code上用kimi和deepseek，会比直接用kimi和deepseek好用很多。所以主观上模型的差距并不大，而是背后的prompt，架构上的优化方面，claude code非常强。

AaronZ_RprY

1个月前浙江

42:42 所以主持人是完全不懂技术是吗…

一粒小小麦子

1个月前四川

感觉主持人自己话有点过多了。建议主持人以后自己少说点，多一点有价值的问题。

白色的蓝

1个月前北京

这期很好， Raymond 问的问题很好，很犀利；嘉宾铁震行业和技术很扎实👍🏼

晨煊-

1个月前北京

张小珺播客最新一期嘉宾其实提到了圈内人大多心照不宣，国内的模型大多是靠蒸馏美国的，只不过通常“软蒸”属于灰色地带，也有其存在即合理之处，其他个别那些“硬蒸”的就纯属偷了，看评论，貌似那家已上市的公司就是“硬蒸”的。所以当宣传追上了，训练成本低时，都实际有另一个故事……https://www.xiaoyuzhoufm.com/episode/6a00aa051b7bd50295dfe41d

HD667885y

1个月前江苏

朴实无华，我也觉得一旦中国大模型抵达opus4.6的可用程度，就能翻盘一切了。这个能力和高可用性能做太多事情。

Shoriscool

1个月前北京

感谢这个播客，很精彩！不仅仅是谈技术细节上的趋势，也照顾到了商业化，tech for good，but如今的ai在产业界变成了裁员的工具。与此同时从业者一个个的又十分焦虑。小到模型的发展大到社会的进步，我们每个人身处一场革命之中。到底谁会成为那个拿着ai这把锋利刀的人？ta会有良心吗？

JZB

1个月前上海

DS的低成本才是未来，只要后续跨过可用线就赢了

HD500838v

1个月前山东

反复尝鲜者表示codex＞claude＞kimi2.6＞deepseek＞glm＞＞minimax

刘春龙_dI7U

1个月前四川

我准备写一篇文章，呼吁大家用deepseek的api。让deepseek的数据飞轮转起来，让deepseek更有钱！别再帮美国模型了。我实测，deepseek v4已经完全可以平替sonet4.6，只是偶尔会做点出格的事情。就像一个调皮的小孩一样。但是这个小孩是我们自己的，我不能说你调皮，我不爱你了，我去看美国小孩吧。我觉得应该多用，多反馈，deepseek就能越快变更好。