Album
时长:
16分钟
播放:
210
发布:
6个月前
简介...
https://xiaoyuzhoufm.com

自从 DeepSeek 爆火后,铺天盖地的新闻都在报道“某某公司全面接入 DeepSeek”,甚至连阿里巴巴的云服务也随之水涨船高,热度飙升。那么,这里提到的“全面接入”到底意味着什么?其实,它背后涉及一个核心概念——大模型的部署。但究竟什么是大模型部署?为什么企业要部署大模型?有哪些不同的部署方式?这些部署方式又是如何与云服务厂商紧密相关的?今天这期节目,就一一解读这些关键问题。


00:53 大模型的部署,是指将已经训练好的大模型,比如GPT或DeepSeek等集成到实际的应用当中,使其可以被用户或者是系统来调用。


02:02 大模型的部署的最核心的环节,就是模型的托管,hosting。


02:29 无论你选择哪一种的部署方式,都需要根据未来业务量的需求来选择相应的GPU和数量


02:49 根据托管方式的不同,大模型的部署方式也就分为。。。


02:59 云端部署,适用的场景是。。


05:44 公有云部署,某种程度上就像是去酒店去订房间。


06:20 如果你不喜欢公有云部署的弊端,那和公有云对应的这个部署的方式就是私有云部署。


07:14 如果说公有云部署类似于去住酒店,那私有云部署就类似于。。。


08:42 行业里面通用的做法是。。。


11:28 本地部署适用的场景是对于数据隐私有更加严格要求的


12:12 本地部署就相当于是自己给自己建立一套独栋的别墅


13:30 边缘部署,适用的场景是那些需要离线运行或者是在终端设备上运行,比如手机、机器人


15:06 边缘部署,通常采用的是蒸馏过的小模型


15:23 对蒸馏这一概念感兴趣的听友,可以去我的第96期节目

评价...

空空如也

小宇宙热门评论...
jeff在pokkoa
6个月前 上海
1
我们自己的practice. 拥有自己足够的domain数据, 然后主要靠post-trained. 省了不少钱, “降本增效”😂
jeff在pokkoa
6个月前 上海
1
btw 现在开始有平台做闲置算力的整合,看来短时间内算力会越来越便宜
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧