【学习笔记】生成式AI模型
生成式AI模型简介
生成式模型(Generative Model)是机器学习中的一种重要模型类型,又称概率模型。它的核心原理是通过学习数据的分布来建立概率模型,进而利用这个模型来生成新的数据。生成式模型不仅关注已有数据的分类,更将数据的生成看作是一个从先验分布中抽取样本的过程。
Generative Model的主要生成过程见下图,其中蕴含了几个不同的类型的样本和生成的效果:
图1:生成式AI的概述
不同类型的生成式AI模型
Generative Model的模型种类也多种多样,分为”VAE”, “Flow-based”, “Diffusion”和“GAN”这几种。
· VAE(变分自编码器)
VAE(变分自编码器)是一种生成模型,是自编码器的一种变体。它结合了自编码器的数据压缩与重
构能力,并引入概率分布的假设,使得模型能够生成新的数据。VAE的核心思想是将输入数据映射到
一个潜在空间中,并在该空间中进行采样以生成数据。这种潜在空间通常建模为一个高斯分布,使
得VAE能够通过学习分布的参数来生成新的样本。然而,VAE的训练过程相对复杂,需要较多的计算
资源和时间。
图2:VAE的基本示意图
· Flow-based Model
Flow-based模型是一种用于概率建模的方法,尤其在生成模型或密度估计中表现出色。其主要思想
是通过一系列的可逆变换来生成数据,这些变换可以看作是从一个初始分布逐步转换到目标分布的
过程。由于这些变换是可逆的,因此可以使用神经网络来有效地实现它们。Flow-based模型相比于
传统生成模型具有更高的灵活性和效率。
图3:Flow-based的基本示意图
· Diffusion
Diffusion模型在深度学习和人工智能领域中广泛应用于生成高质量、逼真的数据,尤其在图像生
成方 面取得了显著成效。该模型的基本思想是从一个随机的噪声数据开始,逐步将其转化为有意
义的数据(如图像)。这个过程模拟了物理中的扩散现象,包括正向过程(将真实数据逐渐添加
噪声转化为噪声)和逆向过程(从纯噪声中逐步去除噪声恢复成结构化的数据)。Diffusion模型
能够生成非常高质量和逼真的图像,因此在艺术创作、数据增强和模型训练等领域具有广泛的应
用价值。
图4:Diffusion的基本示意图
· GAN
GAN是一种深度学习模型,通过生成模型(G)和判别模型(D)之间的对抗学习来产生高质量的输
出。判别模型的任务是区分一个样本是真实的还是由生成模型生成的,而生成模型则试图生成能
够欺骗判别模型的样本。这两个模型在训练过程中相互竞争,最终达到一个平衡点,此时生成模型
能够生成与真实数据难以区分的样本。GAN在图像生成、语音合成和文本生成等领域都有广泛的
应用。
图5:GAN的基本示意图
总的来说,生成式模型具有广泛的应用前景和研究价值,能够处理大规模、高维的数据,并生成更加真实、高质量的样本。然而,它也存在一些挑战,如模型的复杂性、计算资源的消耗以及数据的质量和多样性等问题,需要持续的研究和改进。