在生成式人工智能(GenAI)领域,专利趋势主要集中在三种核心模型:生成对抗网络(GANs)、变分自编码器(VAEs)和扩散模型。
其中生成对抗网络(GANs)领域的专利数量是最多的:
生成对抗网络(GANs)
专利数量:自2014年以来,GAN相关的专利家族数量接近9700个,其中2023年发布了约2400个新专利。
优势:高保真度:GANs能够生成极为真实的图像,尤其适合需要高质量输出的应用。
快速生成:由于其架构,GANs通常在推理速度上优于其他模型,能够迅速生成样本。
劣势:训练困难:GANs的训练过程复杂,容易出现模式崩溃(mode collapse),导致生成样本缺乏多样性。
对数据敏感:在小数据集上表现良好,但在大数据集上可能面临训练不稳定的问题。
这也造成了近几年GANs模型增长率增长缓慢甚至下降的趋势。
变分自编码器(VAEs)
专利数量:自2014年以来,VAEs的专利家族数量约为1800个。
优势:高多样性:VAEs通过编码器-解码器架构捕捉输入数据的分布,从而生成多样化的样本。
稳定性:相较于GANs,VAEs的训练过程更为稳定,易于收敛。
劣势:低保真度:生成的图像往往模糊,不如GANs清晰,适合需要多样性而非高保真的应用。
信息损失:由于其像素级损失函数,可能无法保留输入图像的细节。
扩散模型
专利数量:扩散模型的专利家族从2020年的18个激增至2023年的441个,显示出快速增长趋势。
优势:高保真度与多样性兼具:扩散模型通过逐步去噪恢复数据,能够同时生成高质量和多样化的输出。
易于训练:相较于GANs,扩散模型通常具有更简单的训练过程,因为它们依赖于可追踪的似然损失。
劣势:处理速度慢:由于其迭代去噪过程,扩散模型在生成样本时通常比GANs和VAEs慢得多。
计算资源需求高:需要更多的计算资源来处理多次迭代。
对比总结
选择适当的生成式AI模型应考虑具体应用需求。例如,如果需要快速生成高质量图像,可以选择GANs;如果关注多样性且可接受模糊输出,则VAEs是不错的选择;而对于需要同时兼顾质量和多样性的应用,尽管速度较慢,扩散模型可能是最佳选择。
原文始发于微信公众号(AI技术笔记):生成式AI(GenAI)模型的发展趋势
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论