< 上一个 | 内容 | 下一个 >

2.5.6 展望:从工程化到工业化

随着生成式AI 技术的工程化手段的成熟,我们将迎来生成式 AI的工业化应用阶段。在AI 图像生成领域,工业化具体是指将生成式 AI 技术应用于图像生成过程中的规模化、标准化和商业化,从而将工程化过程中积累的最佳实践与资源复制放大,进一步降低生成式 AI 在应用层面的复杂度和成本。

生成式AI 图像生成的工业化主要具有以下特点:

(1) 大规模生成图像:利用生成式 AI 技术,极少或无需人工干预,快速生成大量的图像和视频,以满足工业化生产和商业需求。这意味着生产者应当有灵活弹性的算力获取方式,以确保高可用性和低使用成本,同时有完善的数据与媒体资源管理系统和机制,以确保实


现生成的数字资产的价值。

(2) 自动化流程:自动化是大规模生产的基础,它将贯穿从数据准备、模型训练、模型发布,到通过简单的输入触发模型,自动生成图像的全过程,无需手动干预。云计算环境中丰富的托管服务、无服务器架构、事件总线,确保用户能够快速构建起高可用、弹性的、高性价比的自动化流程。

(3) 标准化的模型和流程:工业化要求使用标准化的模型和流程,以确保生成结果的稳定性和一致性。这包括使用经过训练和优化的生成式AI 模型,并建立统一的数据处理和后处理流程。

(4) 商业价值的呈现:生成式 AI 图像生成的工业化不仅仅是一种技术探索,更注重其商业价值。这包括将生成的图像更广泛地被应用于广告、媒体、设计、创意产业等领域,以实现商业利益和创收。

从使用者的视角,我们会看到以下变化:

(1) 重新定义一些行业的生产流程。生成式 AI 技术是一种先进的生产力,它将改变原有的生产者角色,催生出新的生产流程,对生产者提出新的职业要求。图 5 所示是一种以生成式 AI 技术为主线的图像生产流程构想。在这种生产线中,美术总监不仅具有极强的审美设计能力,还具有一定的技术能力,熟练使用 ControlNet 等工具。他通过提示词和ControlNet 模型,掌控项目的美术风格,由后台批量生成图片。设计人员从大量图片中进行挑选,利用生成式AI 工具精修,并将修改意见反馈给美术总监;美术总监再根据反馈修改参数,调整批量生图的效果。


image


2-20 新生产流程示意图


(2) 应用界面的进一步简化与定制化。简单的应用界面有助于降低使用门槛,让更多的普通用户和设计师使用AI 图像生成技术。极简的应用界面也正是 Midjourney 迅速走红、吸引大量用户尝试的重要因素。随着新生产流程的形成,以及AI 图像生成经验的积累,不同行业的企业类用户会针对自己的业务流程与需求定制应用界面,隐藏复杂的配置参数,通过 API 技术调用Stable Diffusion 等模型和相关生成式AI 的处理操作,给普通用户提供简洁的应用界面,进一步提高工作效率。

(3) 模型应用方式更加便捷和多样。在当前的应用场景中,用户一般通过 HuggingfaceCivitai 等网站下载模型后,在自己的环境中进行微调和构建应用。在下一阶段,用户可以通过 API 直接调用模型,无须自己预置模型推理和训练的资源,从而进一步降低构建应用的门槛。Amazon Bedrock 是亚马逊云科技针对生成式AI 领域推出的最新的服务,是使用基础模型 (FM) 构建和扩展生成式AI 应用程序的最简单方法,为所有开发者降低使用门槛。它在 2023 世界人工智能大会 (WAIC 2023) 展品评选中入选 2023 九大”镇馆之宝“之一。通过 Bedrock 服务,客户可以通过 API 访问来自 AI21 LabsAnthropicStability AI Amazon Titan 的基础模型,例如Titan Text Jurassic-2


ClaudeStable Diffusion XL 等。借助 Bedrock 的无服务器体验,用户可以结合自身应用场景轻松找到适合的基础模型,快速上手;在确保数据安全和隐私保护的前提下,使用自有数据基于基础模型进行微调和定制,使得模型效果更加符合自身的业务场景;并使用他们已经熟悉的亚马逊云科技工具和能力,将定制化模型集成并部署到他们的应用程序中,同时不需要管理任何基础设施。

生成式AI 的工业化将在更大范围更深远地影响我们的生产和生活,也给我们带来了数据管理、数据隐私、AI 伦理、版权保护等诸多新问题和新挑战。我们需要持续关注和思考生成式AI 技术的进步和优化,以确保AI 生成的图像能够被安全、合规、可持续地用于商业应用,并产生积极的社会价值。