< 上一个 | 内容 | 下一个 >

2.4.1 判别式技术发展综述

判别式技术在AIGC 领域中具有重要的作用,可以实现分类和预测、特征提取和表示学习、异常检测和异常行为识别,以及决策支持和优化等多种任务。它为我们理解和应用数据中的模式和信息提供了有效的工具和方法。判别式技术可以基于已有数据对样本进行分类或预测。判别式模型关注数据与标签之间的关系,通过学习特征和建立决策边界来进行分类。早期的判别式模型包括支持向量机、逻辑回归和深度神经网络。例如, Alex Krizhevsky 等人在 2012 年提出的



4 Stable AI https://stability.ai/


5 Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative adversarial nets[J]. Advances in neural information processing systems, 2014, 27.

AlexNet 模型6,通过深度卷积神经网络实现了在ImageNet 图像分类竞赛中的突破。后来,Vaswani 等人在 2017 年提出了Transformers7,并在自然语言处理和计算机视觉领域取得了巨大的成功。 Transformers 基于自注意力机制,通过对输入序列中不同位置的关系进行建模,实现了更好的特征表示和序列建模能力。现在,Transformer模型已成为视觉以及自然语言处理领域的重要基石,如 Google BERT8就是基于这一模型。Vision Transformer (ViT)9将自注意力机制

引入计算机视觉领域。它通过将图像划分为一系列的图像块,并利用

Transformer 模型进行特征提取和分类,取得了与传统卷积神经网络相媲美的性能。


6 Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). ImageNet classification with deep convolutional neural networks. In Advances in neural information processing systems (pp. 1097-1105).

7 Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[J]. Advances in neural information processing systems, 2017, 30

8 Devlin J, Chang M W, Lee K, et al. Bert: Pre-training of deep bidirectional transformers for language understanding[J]. arXiv preprint arXiv:1810.04805, 2018.

9 Dosovitskiy A, Beyer L, Kolesnikov A, et al. An image is worth 16x16 words: Transformers for image recognition at scale[J]. arXiv preprint arXiv:2010.11929, 2020.


image


2-2 StyleGAN 生成结果图(来源:StyleGAN10)