Album
时长:
24分钟
播放:
228
发布:
2个月前
主播...
简介...
https://xiaoyuzhoufm.com

根据一句话创作图片,对于人类来说是一项专业性很强的工作,但在今天越来越多的AI模型已经可以通过计算来完成。在使用之余,你有没有想过这究竟是如何实现的?它违反直觉的地方是如此之多,例如从文字prompt到图片输出,实现了信息载体从一维到二维结构的跨越;除此之外,AI还有着和人类截然不同的创作路径,它的绘画就像把布朗运动的分子重新排布得井然有序一样,是一种违反直觉的熵减过程。前面的节目基于LLM解释了大模型的基本架构和底层原理,基于此我们继续向图片模型走去,一窥AI生图的底层秘密。

评价...

空空如也

小宇宙热门评论...
ZnZn
2个月前 美国
1
好清晰易懂的科普!最近正好在试着用gpt5设计Logo,哪怕给同样的prompt,每次返回的成图也多少有些差别,比如图片中的人物从圆眼变成眯眼、胡子的范围有变化等等,甚至图片的某个细节会出现不合乎常理的“悬浮感”,让人难以掌控感~看来模型已经尽力扩散到一个流体了,流体上具体哪个点就不好说了~
里维糖
2个月前 北京
0
节目里讲到的那个词是流形 manifold,不妨理解为空间里的一个区域。
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧