代码时光机 - Vol.40 AI生图是受控熵减的时光倒流 - EarsOnMe

主播

节目简介

来源：小宇宙

根据一句话创作图片，对于人类来说是一项专业性很强的工作，但在今天越来越多的AI模型已经可以通过计算来完成。在使用之余，你有没有想过这究竟是如何实现的？它违反直觉的地方是如此之多，例如从文字prompt到图片输出，实现了信息载体从一维到二维结构的跨越；除此之外，AI还有着和人类截然不同的创作路径，它的绘画就像把布朗运动的分子重新排布得井然有序一样，是一种违反直觉的熵减过程。前面的节目基于LLM解释了大模型的基本架构和底层原理，基于此我们继续向图片模型走去，一窥AI生图的底层秘密。

小宇宙热评

ZnZn

9个月前美国

1

好清晰易懂的科普！最近正好在试着用gpt5设计Logo，哪怕给同样的prompt，每次返回的成图也多少有些差别，比如图片中的人物从圆眼变成眯眼、胡子的范围有变化等等，甚至图片的某个细节会出现不合乎常理的“悬浮感”，让人难以掌控感～看来模型已经尽力扩散到一个流体了，流体上具体哪个点就不好说了～

里维糖

9个月前北京

0

节目里讲到的那个词是流形 manifold，不妨理解为空间里的一个区域。

Vol.40 AI生图是受控熵减的时光倒流

加入我们的 Discord

扫描微信二维码

播放列表