GAN 与 VAE:最好的生成 AI 方法是什么?
生成式AI在科技领域正在兴起。两种流行的方法是GAN和VAE。
生成对抗网络(GAN)和变分自动编码器(VAE)均属于Latent variable models,是两种比较流行的生成式 AI 技术。 一般来说,GAN 往往更广泛地用于图像处理,而 VAE 则更多地用于信息压缩。
#宽客进化:生成式AI模型概述生成式AI技术有助于创建AI模型、 合成数据和逼真的多媒体,例如语音和图像。尽管这些技术有时用于创建人像合成,但它们也可以为电影创建逼真的配音并从简短的文本描述中生成图像。 他们应用于制药、设计、算法等领域。
GAN 是如何工作的?
GAN 于 2014 年由蒙特利尔大学的 Ian Goodfellow 和其他研究人员首次引入。它们在生成多种类型的真实数据方面表现出了巨大的潜力。Meta 的首席人工智能科学家 Yann LeCun 写道,GAN 及其变体是“过去十年机器学习中最有趣的想法”。
对于初学者来说,它们已被用于生成逼真的语音,模仿人类以获得更好的翻译,包括匹配声音和嘴唇动作。 他们还翻译了图像并区分了白天和黑夜,以及描绘了身体之间的舞蹈动作。 它们还与其他 AI 技术相结合,以提高安全性并构建更好的 AI 分类器。
GAN 的实际机制涉及两个神经网络的相互作用,它们共同生成并分类代表现实的数据。GAN 使用生成器生成内容,该生成器的生成内容被第二个神经网络进行测试:鉴别器网络,它确定内容是否看起来“真实”。这种反馈有助于训练更好的生成器网络。鉴别器还可以检测虚假内容或不属于域的内容。随着时间的推移,两个神经网络都会变得更好,反馈帮助他们学习生成尽可能接近现实的数据。
#宽客进化:什么是生成对抗网络(GANs)VAE 如何工作的?
VAE 也于2014年首次推出,由谷歌研究科学家 Diederik Kingma 和阿姆斯特丹大学机器学习研究主席 Max Welling 提出。 VAE 还可以为具有不同机制的各种任务创建更有效的分类引擎。 它们的核心是建立在组成的神经网络自动编码器上:一个编码器和一个解码器。 编码器优化表示数据的更有效方式,而解码器优化重新生成原始数据集的更有效方式。
传统上,自动编码器技术清理数据、改进预测分析、压缩数据并为其他算法降低数据集的维数。VAE 更进一步,以尽量减少原始信号的误差与重建误差。
企业内容管理软件提供商 Hyland 的产品经理 Tiago Cardoso 说:“VAE 在提供接近原始的内容方面非常强大,只需减少矢量即可。它还允许我们生成不存在的内容。”
VAE 与 GAN 的比较
将GAN与VAE并置时发现的最大区别在于它们的应用方式。管理咨询公司 Kearney 的数字化转型实践合伙人 Pratik Agrawal 表示,GAN 通常用于处理任何类型的图像或视觉数据。他发现 VAE 更适用于信号处理用例,例如预测性维护或安全分析应用程序的异常检测。
Agrawal 说,由于 VAE 和 GAN 都是神经网络的示例,因此它们的应用可能仅限于实际的实时业务示例。使用这些技术的数据科学家和开发人员必须将结果与输入联系起来并运行敏感性分析。还必须考虑这些解决方案的可持续性等因素,并说明由谁运行它们、维护它们的频率以及更新它们所需的技术资源。
推荐阅读:
#宽客进化:什么是合成数据#宽客进化:生成式AI模型——自回归模型 ARM#宽客进化:生成式AI模型——自回归模型ARM的时序卷积神经网络#宽客进化:浅谈:“生成式AI”与“判别式AI”的区别#宽客进化:生成对抗网络(GAN)的损失函数收敛问题#宽客进化:让人工智能来告诉你《权力的游戏》原著中龙妈长啥样北京宽客进化科技有限公司
——用数据智慧加速人工智能
问答宝 - 全球领先中文问答互动平台
全部 0条评论