2.4.2 生成式技术发展综述

2.4.2 生成式技术发展综述‌

生成式技术在AIGC 领域中也扮演着重要角色，它在数据生成和增强、无监督学习、视觉和语言生成、强化学习和策略生成，以及创意和艺术生成等方面为我们开启了创造性和多样性的视角，推动了智能系统在创造、理解和交互方面的进步。生成式技术通过学习数据分布模型来生成新的数据样本。这些模型通常基于概率模型，如生成对抗网络和变分自编码器。其中，生成对抗网络在图像生成领域取得了重大突破，其用于生成逼真的图像样本。后来，Tero Karras 等人提出 StyleGAN11，用于生成逼真的人脸图像。它通过在生成网络中引入风

10 Karras T, Laine S, Aila T. A style-based generator architecture for generative adversarial networks[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2019: 4401-4410.

11 Karras T, Laine S, Aila T. A style-based generator architecture for generative adversarial networks[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2019: 4401-4410.

格向量，并采用渐变叠加的训练方法，生成高分辨率、多样化和具有艺术风格的人脸图像。人脸中的“Style”通常是指头部的姿态、面部的表情、人物的发型等。如图 3-2 所示，StyleGAN 生成的人脸可以捕获到这些细节并生成高质量的图像，而且在不同分别率的条件下有一致的表现。OpenAI 团队提出的 GPT 基于深度自回归 Transformer模型。它在自然语言处理任务中取得了突破性的成果，具有强大的语言生成能力和广泛的应用前景。最近，Stable Diffusion12作为一种生成式技术，提供了一种有效的方法来生成高质量的图像样本。该方法通过对噪声进行多步扩散来生成图像，每一步都会逐渐减小噪声的规模，使生成的图像逐渐变得清晰。Stable Diffusion 在生成图像的质量和多样性方面取得了显著的进展，并被广泛应用于图像生成任务。

< 上一个 | 内容 | 下一个 >