GAN网络概述及LOSS函数详解

用GAN得有GPU

分类：机器学习

发布时间 2021.05.12阅读数 6351 评论数 0

Generative Adversarial Nets

上周周报已经写了这篇论文，本周相对GAN网络的LOSS进行进一步的学习和研究。

GAN网络：

在这里插入图片描述

条件：G依照真实图像生成大量的类似图像，D是辨别输入的图像是真实图像还是G生成的虚假图像。

原理：G和D是互相促进的。G的目的是产生的图像让D感到模糊不知道该分成realistic（看起来像是现实的）还是fake（看起来是假的），D的目的是将realistic和fake的图像准确

分辨。所以G产生的图像会越来越真，D的辨别能力会越来越强，最终达到一个平衡。这种纳什均衡保证了GAN产生的所有图像都可以与原始图像属于一个类别。

作用：GAN大量用于扩充数据集或者给未标记的数据集打标签等任务上。

一些GAN网络的比较：

1，用于图像生成方面

在这里插入图片描述

2.用于风格迁移

在这里插入图片描述

3.图像还原与修复

在这里插入图片描述

LOSS：
对于真实数据，令LABAL=1计算代价函数来训练判别器：

d_loss_real = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_real, labels=tf.ones_like(d_logits_real) * (1 - smooth)))

对于生成器，令LABAL=0计算代价函数来训练判别器：

d_loss_fake =
tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_fake, labels=tf.zeros_like(d_logits_fake)))

所以判别器的代价函数为：

d_loss = d_loss_real + d_loss_fake

具体解释如下：

有两个Loss：Loss_D（判别网络损失函数）、Loss_G（生成网络损失函数）。

Loss_D只有两个分类，Real image判为1，Fake image（由G生成）判为0，因而可以用二进制交叉熵（BCELoss）来实现Loss_D。

熵（Entropy），是描述一个随机信号源的信息量的指标，为叙述方便，采用离散信号源。设信号源(S)可以发送N个符号{S1,S2,…,SN}，符号Si出现的概率为Pi，则该信号源所

发送一个符号的平均信息量，即熵为：

在这里插入图片描述

于是，熵就可以看成是一个概率的信息度量，于是从信息论过渡到概率度量上。对于连续概率分布，使用概率密度P(x)代替（1）式中的概率Pi，有：

在这里插入图片描述

交叉熵（Cross Entropy）是描述两个随机分布（P、Q）差异的一个指标，其定义如下：

在这里插入图片描述

P、Q的顺序不能互换。当P与Q相同时，交叉熵取最小值，此时计算的是P（或Q）的熵。

所谓二进制交叉熵（Binary Cross Entropy）是指随机分布P、Q是一个二进制分布，即P和Q只有两个状态0-1。令p为P的状态1的概率，则1-p是P的状态0的概率，同理，令q为Q

的状态1的概率，1-q为Q的状态0的概率，则P、Q的交叉熵为(只列离散方程，连续情况也一样)：

在这里插入图片描述

在GAN中，判别器（Discriminator）的输出与ground-truth（它的取值只有0-1）被看作是概率。交叉熵就是用来衡量这两个概率之间差异的指标：p反映的是ground-truth认为来

自real的概率，用L表示（ground truth label）此分布，它只取两个值100%和0%，即1和0；q反映的是Discriminator认为的来自real的概率，用D（Discriminator prediction）表示

此分布，它的取值是[0,1]。

一个样本（1幅图片）x，假如来自real，p则为1，q为D(Xr)，其交叉熵输出是：

在这里插入图片描述

假如来自fake，p则为0，q为D(Xf),其交叉熵为：

在这里插入图片描述

于是，对于一个样本集，一半来自真实（real），一半来生成器（fake），其交叉熵的平均是：

在这里插入图片描述

D的目标是让Pd接近理想概率分布Pi（Pi分布是：real sample输入时，概率输出为1；fake sample输入时，概率输出为0）。因此交叉熵越小越好，即：

在这里插入图片描述

传统的GAN的object function是：

在这里插入图片描述

公式(7)中Loss_D等于object function取负号,loss越小越好。两类别各自的期望：

在这里插入图片描述

Discriminator的Loss:

即让D判断real和fake的能力越高越好，即real越接近1越好，fake越接近0越好。

在这里插入图片描述

Generator的Loss:

即让G尽可能以假乱真，即real越接近0越好，fake越接近1越好。公式9为公式6中的Xr，Xf互换，H(L∣Df)是输入fake图像，判为1。

在这里插入图片描述

参考文献：Generative Adversarial Nets
https://blog.csdn.net/StreamRock/article/details/81096105

深度学习,机器学习,GAN

打赏 0

下一篇：深度迁移学习概述

GAN网络概述及LOSS函数详解

用GAN得有GPU

GAN网络：

一些GAN网络的比较：

为你推荐

Matlab深度学习实战一：LeNe-5图像分类篇MNIST数据集分十类且matlab提供模型框架全网为唯一详细操作流程

机器学习笔记-决策树调参思路

win10系统下使用openvino部署yolov5模型

姿态估计CPM

(4) 线性分类 Linear Classification (b) : Logistic 回归，判别式与生成式模型，广义线性模型 - PRML && CS229

精选自然语言处理从入门到应用——静态词向量：全局向量词嵌入GloVe（Global Vectors for Word Representation）

关于作者

用GAN得有GPU

2

0

0

1

GAN网络概述及LOSS函数详解

深度迁移学习概述

相关推荐

VGG Face数据集多线程下载

精选Bert模型之unable to parse config.json as a URL or as a local path错误解决方案

目标检测模型的评估指标mAP详解(附代码）

【从0入门AI深度学习】华为ModelArts与深度学习简介（公开课笔记）

强化学习(十二) Dueling DQN

k210实现人脸检测（很详细）MaixDock -1

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

GAN网络概述及LOSS函数详解

用GAN得有GPU

GAN网络：

一些GAN网络的比较：

为你推荐

Matlab深度学习实战一：LeNe-5图像分类篇MNIST数据集分十类且matlab提供模型框架全网为唯一详细操作流程

机器学习笔记-决策树调参思路

win10系统下使用openvino部署yolov5模型

姿态估计CPM

(4) 线性分类 Linear Classification (b) : Logistic 回归，判别式与生成式模型，广义线性模型 - PRML && CS229

精选自然语言处理从入门到应用——静态词向量：全局向量词嵌入GloVe（Global Vectors for Word Representation）

评论（0）

关于作者

用GAN得有GPU

2

0

0

1

GAN网络概述及LOSS函数详解

深度迁移学习概述

相关推荐

VGG Face数据集多线程下载

精选Bert模型之unable to parse config.json as a URL or as a local path错误解决方案

目标检测模型的评估指标mAP详解(附代码）

【从0入门AI深度学习】华为ModelArts与深度学习简介（公开课笔记）

强化学习(十二) Dueling DQN

k210实现人脸检测（很详细）MaixDock -1

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板