< 上一个 | 内容 | 下一个 >

2.5.2 AI 生图应用平台

用户通过应用平台设置参数、调用生成式 AI 模型,并获得生成


结果和系统的反馈信息,简单易用、功能完善的应用平台是用户高效完成生成式AI 工作的保障。在 AI 图像生成领域,应用平台的用户人群主要包括算法工程师、制作人、设计师三类。他们虽然职能不同,但对于生成式AI 应用平台的需求在使用成本、使用难度、功能等方面是相通的。

(1) 算法工程师主要负责生成式AI 模型的训练和调优。一方面,他们利用现有素材,根据业务需要,对基础模型微调,以训练出能生成某一风格或某一类图像的模型;另一方面,他们需要不断输入各种参数,用生成的模型进行推理,生成测试图像,以检验模型是否达到预期,能进入实际生产环节。算法工程师需要在训练和推理工作之间不断迭代,通过代码搭建工作流程,在命令行和编程环境完成工作。生成式AI 应用平台提供可视化的用户界面,用于控制参数的快速调节,帮助算法工程师减少代码工作量,将注意力集中在模型效果上,提升工作效率。

(2) 制作人负责提出具体设计要求,并评估设计成果。在传统的设计流程中,由于设计操作的专业性,制作人往往是将设计理念通过文字表达出来,由设计师按照文字要求进行设计。要达成制作人设想的效果,往往需要制作人和设计师之间反复沟通,多轮修改。制作人利用生成式AI 应用平台,可以自己直接将创意通过图像表达出来,再由设计师根据具体要求进行精修,大大节省了需求方与设计方在前期沟通中花费的精力。

(3) 设计师负责执行具体的设计操作,不断调试参数,以获得需要的设计效果。设计师利用生成式AI 应用平台,快捷、批量地生成大量的设计原稿,高效地标记与挑选生成图像结果,并打通设计工作流,将原稿作为输入应用到后续环节进行进一步的人工修改与AI 生图。

目前, 以 Midjourney35 为代表的 SaaS 化商用软件, 以 Stable Diffusion WebUI36ComfyUI37为代表的开源应用是用户使用最为广泛的AI 图像生成领域的应用平台。表 1 对比了两类平台的主要特点。 Midjourney 以简洁易于上手的操作界面和可媲美专业水准的出图效果,率先吸引了大众对 AI 图像生成的关注。Stable Diffusion WebUI是应用最广泛的应用软件之一。Stable Diffusion WebUI 是一个基于 Stable Diffusion 模型的开源项目,利用 Gradio 模块搭建出网页形式的图形化用户界面。SD WebUI 备受欢迎的原因包括:(1) 开源免费,功能快速迭代,支持最新的 AI 生图功能;(2) 安装配置操作简单,普通用户易于上手;(3) 提供丰富全面的控制参数,专业用户可以精细地掌控创作过程;(4) 采用插件机制扩展支持多种功能,吸引了开源社区大量人员参与贡献。ComfyUI 是另一个广受关注的AI 图像生成应用的开源项目。与 Stable Diffusion WebUI 类似,它遵循 GPL-3.0协议开源,普通用户免费使用,可本地部署,无须联网,但建议配备 GPU 卡。与 Stable Diffusion WebUI 最大的不同在于,其应用界面采用节点式的工作流设计模式,适合有 3D 设计软件使用经验的用户。虽然它的上手门槛较高,但具有异步队列系统等 Stable Diffusion WebUI 尚不具备的功能。


2-1 Midjourney Stable Diffusion WebUI 主要特点比较


Midjourney

Stable Diffusion WebUI

费用

有免费出图额度限制,超过限额则需要购买会员

遵循 AGPL-3.0 协议开源,普通用户不需要付费


35 https://www.midjourney.com/


36 https://github.com/AUTOMATIC1111/stable-diffusion-webui


37 https://github.com/comfyanonymous/ComfyUI



Midjourney

Stable Diffusion WebUI

操作体验

界面简洁,操作简单,主要依

靠提示词控制,出图可控性不强

界面功能丰富,出图过程可控性强

运行要求

无本地硬件要求,需要联网运行

无须联网,可完全本地部署,但建

议本地配备 GPU 卡,否则运行效率很低

模型训练

闭源,无法自定义模型和二次训练

开源,用户可以自己训练模型

扩展性

无插件,功能有赖于原厂开发

和更新

采用插件机制,提供丰富的插件,

社区共建


截至 2023 7 月底,Stable Diffusion WebUI 项目在 GitHub 上已获得 93k 颗星,18.3k fork,比ComfyUI 均高出一个量级。同时, ComfyUI 可以通过插件的形式在 Stable Diffusion WebUI 上使用。因此,目前对于个人创作者和企业用户,从使用成本、上手难度、功能与可扩展性等方面综合考虑,Stable Diffusion WebUI 具有优秀的用户体验,是开展AI 图像生成实践的首选。