2.5.1 生成式 AI 工程化面临的主要问题

2.5.1 生成式 AI 工程化面临的主要问题‌

扩散模型的优异性能，以及模型微调技术的发展，激发了人们探索生成式AI 在实际生产生活中应用的热情，也在很短的时间内深深影响了一些行业和职业。自 2022 年底，以文生文产品ChatGPT 和文生图产品 Midjourney 为代表，一系列移动应用、商用产品和开源项目蓬勃涌现，将生成式 AI 推向了寻常百姓家，打开了生成式 AI 技术服务具体业务场景，实现工程化落地的新篇章。

工程化是指在某种产品、项目或系统的设计、开发和运作过程中，将一系列最佳实践、标准化和自动化应用于其中，以确保其高效、稳定、可靠和可维护。生成式 AI 工程化的目的是提高效率、降低成本、保证质量，从而推动生成式 AI 技术价值的实现。根据目前生成式 AI技术发展与应用的现状，在开展生成式AI 工程化实践中，主要需要考虑以下三方面的问题。

(1) 确保良好的用户体验。工程化以应用为最终目的，需要确保使用者的体验，从而使用户能够高效地完成生成式AI 的工作。软件工程的先进理念和技术资源为此打下了基础。众多的前端架构不仅使生成AI 应用的用户界面美观易用，交互体验好，而且提高了开发的效率。以服务为中心的设计理念，以及模块化和 API 技术的最佳实践，确保了应用系统的构建效率和易维护性。插件式结构与开源软件模式，能充分激发技术社区的活力，推动应用的快速迭代，为用户不断提供和升级丰富的功能。

(2) 灵活获取算力资源。生成式 AI 应用的一个重要特点，就是需要大量的算力资源。资源有限、GPU 一卡难求，是很多企业用户面临的问题；本地单机工作的效率不高，常常需要多个任务排队等待，是很多个人用户的现状。此时，利用云计算资源，按需使用，动态分配资源，成为缓解上述算力需求压力的途径之一。

(3) 稳定控制生成效果。目前生成式 AI 的生成结果往往带有随机性和不确定性，原因复杂多样，例如：生成式AI 的基础模型通常基于概率模型，生成过程中利用随机性；训练数据不足或不足够多样化，使模型无法捕捉到数据的潜在分布，从而导致生成结果不稳定；某些模型对初始文本或提示敏感，输入条件的微小变化可能导致生成结果的巨大差异；等等。这一问题也导致了AI 生成类视频应用的成熟度明显落后于AI 生成图像，因为前者需要解决帧与帧之间的生成稳定性。要解决这一问题，不仅需要在理论上获得突破，也需要在技术实践中进行探索。

除此之外，伴随着工程化实践的开展，有些问题也在逐渐显现，需要引起我们的关注。模型是生成式AI 应用的基础，当前大量生成式AI 模型不断涌现，性能日新月异。一方面，基础模型提供商 (model provider)、使用基础模型调优提供服务的厂商 (model tuners)，以及可能涉及的监管机构面临着安全、规范、便捷地发布与管理模型的问题。另一方面，面对如此众多的模型，用户也面临着高效搜索与调用模型的问题。生成式 AI 大大提升了创作效率，同时也生成了海量的媒体资源。因此，需要高效地对这些资源进行存储、管理与价值挖掘。处理得当，它们对用户是宝贵的资产；处理不当，反而会成为用户的包袱，造成信息过载和额外的应用成本。

< 上一个 | 内容 | 下一个 >