联系我们

AI 101.

什么是生成的对抗性网络(GaN)?

mm

更新

 on

生成的对抗网络(GANS)是神经网络架构的类型能够生成新数据这符合学习模式。 GAN可以用于生成人面或其他物体的图像,用于执行文本到图像翻译,将一种类型的图像转换为另一个类型,并增强其他应用中图像(超分辨率)的分辨率。因为GAN可以生成完全的新数据,所以它们位于许多尖端AI系统,应用和研究的头部。然而,GANS如何工作?让我们探讨GANS如何运作,并查看他们的一些主要用途。

定义生成式型号和GAN

GaN是生成模型的示例。大多数AI模型可分为两类中的一个:监督和无监督的模型。监督学习模型通常用于区分不同类别的输入,以分类。相比之下,无监督的模型通常用于总结数据的分布,通常是学习数据的高斯分发。因为他们了解数据集的分发,所以它们可以从此学习的分发中拉动样本并生成新数据。

不同的生成模型具有不同的生成数据和计算概率分布的方法。例如,天真的贝叶斯模型通过计算各种输入特征和生成类的概率分布来操作。当天真贝叶斯模型呈现预测时,它通过采取不同变量的概率并将它们组合在一起来计算最可能的类。其他非 深度学习 生成型号包括高斯混合模型和潜在的Dirichlet分配(LDA)。 基于深度倾斜的生成模型 包括 受限制的Boltzmann机器(RBMS), 变形自动化器(VAES)当然,Gans。

生成的对抗性网络是第一次由Ian Goodflow在2014年提出他们于2015年由Alec Redford和其他研究人员提出改善,导致GAN的标准化建筑。 GAN实际上是两个不同的网络连接在一起。巴斯是由两半组成:一代模型和鉴别模型,也称为发电机和鉴别器。

GaN建筑

生成的对抗性网络是从发电机模型和鉴别器模型组成。生成器模型的作业是根据模型从训练数据中学到的模式创建新的数据示例。鉴别者模型的作业是分析图像(假设它在图像上培训)并确定图像是否生成/假或正版。

这两种型号互相击中,训练了游戏理论时尚。发电机模型的目标是生产欺骗其对手的图像–鉴别者模型。同时,鉴别者模型的工作是克服其对手,发电机模型,并捕获发电机产生的假图像。型号彼此接触的事实导致两种模型改善的臂竞争。鉴别器获得反馈关于哪些图像是真实的,并且发电机产生的图像是哪些图像,而发电机被馈送到哪个图像被标记为鉴别器的图像被标记为假。在培训期间,这两种模型都会改进,目的是培训一个生成模型,该模型可以产生基本上无法区分的假数据,从真实的,真正的数据中基本上无法区分。

一旦在训练期间创建了数据的高斯分发,可以使用生成模型。发电机模型最初馈送随机向量,它基于高斯分布转换。换句话说,矢量种子这一代。培训模型时,向量空间将是数据的高斯分布的压缩版本或表示。数据分发的压缩版本被称为潜在空间或潜在变量。稍后,GaN模型然后可以采取潜在空间表示并从中绘制点,可以给予生成模型,并用于生成与训练数据高度相似的新数据。

鉴别器模型是从整个训练域中的示例,其由真实和生成的数据示例组成。实际示例包含在训练数据集中,而假数据由生成模型产生。培训鉴别器模型的过程与基本的二进制分类模型培训完全相同。

GaN训练过程

让我们看看整个 训练 过程 对于一个假设的图像生成任务。

首先,GaN使用真正的真实图像培训,作为训练数据集的一部分。这设置了判断器模型以区分生成的图像和真实图像。它还产生了生成器用于产生新数据的数据分布。

生成器采用随机数值数据的向量,并根据高斯分布转换它们,返回图像。该生成的图像与来自训练数据集的一些真实图像一起送入鉴别器模型。鉴别器将呈现关于它接收的图像的性质的概率预测,输出0和1之间的值,其中1通常是真实的图像,0是假图像。

播放中有一个双反馈回路,因为地面鉴别器被送入图像的地面真理,而发电机通过鉴别器提供了对其性能的反馈。

生成和歧视模型正在互相播放零和游戏。零和游戏是一个一侧的增益以另一侧的成本(总和均为零Ex)。当鉴别器模型能够成功区分实际和虚假的示例时,对鉴别器的参数没有变化。但是,当失败区分真假图像时,对模型的参数进行了大量更新。对于生成模型,反向是真的,它是惩罚(及其参数更新的参数)当它无法欺骗判别模型时,但否则它的参数不变(或者它被奖励)。

理想情况下,发电机能够将其性能提高到鉴别者不能在假冒和真实图像之间辨别的程度。这意味着鉴别者将始终是实际和假图像的%50的概率,这意味着生成的图像应该与真正的图像无法区分。在实践中,GAN通常不会达到这一点。然而,生成模型不需要创建完全类似的图像,仍然有用于用于许多任务GAN。

GaN应用程序

甘 S拥有许多不同的应用,大多数人围绕图像的图像和图像的组件旋转。 GAN通常用于任务,其中所需的图像数据丢失或有限地限制为生成所需数据的方法。让我们来检查GAN的一些常见用途案件。

为数据集生成新示例

甘 可用于为简单图像数据集生成新示例。如果您只有少数训练示例并且需要更多培训示例,则可以使用GAN来为图像分类器生成新的训练数据,以不同的方向和角度生成新的训练示例。

产生独特的人脸

The woman in this photo doesn’t exist. The image was generated by StyleGAN. Photo: Owlsmcgee via Wikimedia Commons, Public Domain (//commons.wikimedia.org/wiki/File:Woman_1.jpg)

当足够训练时,GAN可以用来产生极其现实的人脸图像。这些生成的图像可用于帮助培训面部识别系统。

图像到图像翻译

g Excel在图像翻译。 甘 可用于将黑白图像彩色,将草图或图纸转换为摄影图像,或者将图像从日夜转换为摄影图像。

文本到图像翻译

文本到图像翻译是可以通过使用GANS。随便提供描述图像的文本以及伴随图像时,GaN可以培训以创建新图像当提供所需图像的描述时。

编辑和修复图像

甘 可用于编辑现有照片。 g删除像雨或雪一样的元素来自图像,但它们也可以用来修复旧的,损坏的图像或损坏的图像。

超级分辨率

超级分辨率是采用低分辨率图像并将更多像素插入图像的过程,从而提高该图像的分辨率。 GAN可以训练拍摄图像生成该图像的更高分辨率版本。

Blogger和Programmer有专业的机器学习深度学习话题。丹尼尔希望帮助别人利用AI的力量来社交。