3.8.1 人工智能创作的发展趋势

现有关于AI 技术的研究为数字艺术提供了基础。2014 年对抗性生成网络（GAN，2014）和可变自编码器（VAE）的提出将 AI 生成

任务的研究推进到发展高峰，英伟达的 StyleGAN 一代和二代（2018、 2022）是曾经的标杆。当下正处在大模型与基于自回归模型的扩散模型迅猛发展的时代。随着大模型的参数不断提升，涌现 GPT4、Dall-E、 Midjourney 等优秀的生成工具，又如 Google 的 PaLM-E、微软的 Visual-GPT 已朝着多模态（非单一生成类）的方向发展。诸多科技会议开始下设了 AI+艺术的板块，这也标志着 AI 开始更多地影响艺术与文化的发展。AI 领域多采用量化评价机制，如图像识别有 ImageNet等各类标准化方法来衡量算法的能力，但是同为计算机视觉类任务子集的生成任务领域却由于结果评价方式的主观性而迟迟没有建立相应的评价标准。与此同时，这也是本课题试图解决的问题。

针对文化产业数字化转型的研究也较多，均指出国内外数字文化产业呈现出发展战略化、深度融合化和产业互联化的特征，表现出了强劲的增长态势和广泛渗透性。具体的研究也从针对数字出版，逐步转向对网络空间、数字经济促进文化方面的研究。随着AI 的发展，评述其宏观社会影响和针对国内外文化产业的研究也较充分。

反思AI 社会影响、意义和论证其伦理如数据偏见、隐私问题的论文也较多，如提示了利用AI 进行数字艺术创作时应注意和规避的问题，同时也可以作为创作主题。近期与数字艺术结合讨论较多的是美国研究人员在探讨由AI 生成的艺术作品的归属权问题，即使是完全由算法生成的艺术作品，也离不开人类的创造力、辛勤工作和决策。当AI 系统取得重大成就或引发严重问题时，如何将责任归属于周围的人类是一个复杂的问题。在大模型领域，一些声音指责相关公司训练大模型数据集的版权问题，美国著作权局认定AI 生成图片不受版权保护。这些将直接影响AI 参与数字艺术的成果界定和转化。

在探索AI 与艺术结合的意义方面，提出 AI 艺术的审美不足可能源于技术偏颇和缺乏可计算的“艺术真实”的基本法则。未来AI 艺术需要具备的特点是人类主体的指导和引领。Measuring the intrinsic

dimension of objective landscapes 论述了 AI 技术对视觉艺术的影响和潜力，包括艺术分析和创作方面的任务，并强调其创新性和探索性。使用AI 进行艺术创作可快速生成大量新颖图片、为非专业人士提供创意平台，但作品缺乏情感和主观性可能导致同质化。本课题认为这两个缺点可能会被大模型的高参数和提示词工程（ Prompt Engineering）重定义任务所解决，这也是本节关注的重点之一。

大模型介入数字艺术创作的应用和插件在开源社区内逐步发展，与大模型的学术研究形成互补。如中国研究者提出了 ControlNet 结构，用于控制预训练的大型扩散模型以支持额外的输入条件。化名 AUTOMATIC1111 的开源社区研究者提供了可视化浏览器界面。 CIVITAI 是提供共享预训练模型的平台，但都缺乏正确的内容引导。在大模型时代，需要建立更完整的内容评价标准，正确引导数字艺术创作者。

综上，现有研究虽然针对AI 在数字艺术中可能出现的挑战提供了一些解决方案，但缺乏全局视野，不能作为AI 介入数字艺术的应对策略；同时指出针对利用大模型进行数字艺术创作的研究停留在应用类，需要展开更具体的研究探讨。

< 上一个 | 内容 | 下一个 >