你喜欢画画还是看图片?你听说过一种叫做“Stable Diffusion”算法的工具吗?它使用人工智能从文本描述中创造图像。使用 Stable Diffusion 的最著名程序称为 DALL-E,它用于创建各种令人惊叹的图片。现在,主流的人工智能绘图工具基本上都采用 Stable Diffusion 算法,可以根据文本描述创建图像。那么,什么是 Stable Diffusion?
要了解 Stable Diffusion (稳定扩散)的工作原理,我们可以先来了解一下现实世界中我们是如何绘制一幅图片的。假设我们想要画一棵树的图片,我们可以先画出树的基本轮廓,然后逐渐添加越来越多的细节,使它看起来像一棵真正的树。这也是 Stable Diffusion 算法从文本生成图像时所做的事情。
当你为基于 Stable Diffusion 算法的 AI 绘图程序(如 DALL-E)提供文本描述时,它首先会创建图像的基本轮廓。然后,它会逐渐添加越来越多的细节,直到它看起来像一张真实的图片。这个过程被称为“扩散(Diffusion)”,这也是算法名称的由来。
为了使图像更加独特,Stable Diffusion 允许用户调整称为“模型(model)”的设置。模型就像一个按钮,你可以按下它来改变图像的外观。你可以使用各种模型,例如颜色、纹理和形状。你甚至可以使用模式使图像看起来像是由不同材料制成的,例如金属或塑料。这意味着,即使两个人向 Stable Diffusion 程序提供相同的文本描述,由于使用的模型不同,生成的图像也可能非常不同。
另一个可以与 Stable Diffusion 一起使用的工具称为“提示(prompt)”。提示就像你输入的一句话,告诉 Stable Diffusion 你希望图像看起来像什么或者需要包含哪些元素。例如,如果你输入“一只长着彩虹毛发的紫色独角兽”,Stable Diffusion 会尝试创建一张长着彩虹毛发的紫色独角兽的图像。这就像你拥有了一位听话的私人艺术家,可以随心所欲地让他根据你的指令为你画画。你要做的,就是准确地、有创意地给他下指令而已!
下面是一个典型的Stable Diffusion工具界面,其中的“Stable Diffusion checkpoint”就是modal,而下面还有两个输入框用于输入prompt。prompt又分为“(正面)prompt”和“Negative prompt”,所谓prompt就是你想要在画中包含哪些要素,而所谓Negative prompt(负面提示)就是你想在画中排除掉哪些元素,就是不希望在图片中出现的元素。
一个典型的Stable Diffusion工具的界面
通过使用模型和提示,你的私人艺术家可以使用 Stable Diffusion 创建独特而具有创意的图像。这个艺术家不是使用颜料和画笔,而是使用文本和算法来创建令人惊叹的图片。
总之,Stable Diffusion 是像 DALL-E 这样的绘图程序,用于从文本描述生成图像的算法。它的工作原理是逐渐向图像添加越来越多的细节,直到它看起来像一张真实的图片。 模型和提示是可用于调整图像并引导算法朝特定方向发展的工具。通过尝试不同的设置和输入,用户可以根据他们的特定需求创建令人惊叹的独特图像。
以下是可与 Stable Diffusion 一起使用的模型和提示的更多示例:
颜色模型:改变图像中的颜色以创建不同的情绪或主题,例如“明亮欢快”或“黑暗和喜怒无常”。
纹理模型:向图像添加不同的纹理以创建更逼真或风格化的外观,例如“光滑且有光泽”或“粗糙且有纹理”。
形状模型:调整图像中的形状以创建不同的视角或角度,例如“自上而下视图”或“特写”。
提示:输入引导算法朝特定方向发展的文本,例如“会飞的汽车”或“云端城堡”。
Stable Diffusion 最早于2018年在一篇研究论文中被引入,自那以后,研究人员一直在致力于不断改进。他们不断优化算法,提高算法的速度、效率和精度,并添加了新的功能和工具,例如模型和提示,使其更具通用性。虽然 Stable Diffusion 是相对较新的算法,但它仍在不断发展。
最初的 DALL-E 程序由人工智能研究机构 OpenAI 创建。自 2021 年发布以来,DALL-E 以其根据文本描述生成图像的能力而闻名。然而,Stable Diffusion 并不仅仅被 DALL-E 程序所使用。其他研究人员和艺术家也开始使用该算法来创建独特且富有创意的图像。其中一些其他用途包括:
- 生成虚构生物或风景的逼真图像
- 使用 Stable Diffusion 作为数字艺术创作工具
- 在医学和工程等领域开发 Stable Diffusion 的新应用
- Stable Diffusion 不仅仅用于创建炫酷的图片,研究人员和科学家也在使用 Stable Diffusion 来进行各种研究。例如,他们正在使用它来创建蛋白质的 3D 模型,以便更好地理解蛋白质的工作原理。此外,他们还用它来研究太阳能电池板和电池等材料的制造。谁能想到创建图像的程序会如此有用呢?
使用 Stable Diffusion 的另一个著名工具是 CLIP,它是“对比语言-图像预训练”(Contrastive Language-Image Pre-training)的缩写。CLIP 用于教计算机理解文本和图像之间的关系。CLIP 可用于各种应用程序,如图像搜索和推荐系统。
然而,值得注意的是,尽管 Stable Diffusion 算法可以创建出令人惊叹的图像,但这些图像并不总是符合现实中的逻辑或物理规律。因此,在使用这些工具时,需要注意它们的局限性并谨慎使用。
总的来说,Stable Diffusion 算法是一种非常有趣和强大的工具,可以用来创造出独特的、令人惊叹的图像。它基于文本描述创建图像的能力,将人工智能和艺术创造相结合,为我们提供了一种全新的方式来探索和表达创意。
(图片来自WikiArt)
最后告诉你一个有趣的事实:“DALL-E”这个名字是由两位著名艺术家或艺术形象的名字组合而来:西班牙画家萨尔瓦多·达利(Salvador Dali)和皮克斯动画片《机器人总动员》的主角瓦力(Wall-E)。这就像节目的创作者将每位艺术家的最佳作品结合起来,制作出新的和令人兴奋的作品。
(图片来自 hippopx )
因此,如果你对艺术或科学感兴趣,或者只是追求新奇和创意,那么一定要了解 Stable Diffusion 和 DALL-E。谁知道呢,你可能会突发灵感,使用这个强大的工具来创建出令人惊叹的图像。不要忘记始终保持创造力和乐趣!
文中图片除特别注明外,均使用Stable Diffusion应用AUTOMATIC1111 on Mac生成。