首页 > 国内新闻

你不得不了解的深度学习知识(二)

文章作者:来源:www.guiavv.com时间:2020-03-13



你必须理解的深入学习知识

这本书继续,你必须理解的深入学习知识(1),卷积神经网络,和循环神经网络。本节讲述两个常见网络的其余部分!

3代对抗网络C生成对抗网络| GaN

生成对抗网络C GAN是近两年来流行的无监督算法。它可以生成非常逼真的照片、图像甚至视频。它将用于我们手机的照片处理软件。

(1)GAN的最初设计意图

深入学习的最特殊和最强大的地方是能够自己学习特征提取。机器超强的计算力可以解决许多人工无法解决的问题。自动化后,学习能力和适应性更强。

训练集需要大量的手动注释数据,这既昂贵又低效。对于人工判断生成的结果是好是坏也是如此,这具有高成本和低效率的问题。

GAN可以自动完成这个过程并不断优化它,这是一种非常高效和低成本的方法。GAN如何实现自动化?让我们解释一下他的原则。

(2)生成GAN对抗网络的基本原理

假设一个城市处于混乱之中,很快这个城市就会有很多小偷。这些盗贼中有些可能是顶级盗贼,有些可能不熟练。如果该市开始整顿法律和秩序,并突然发起一场打击犯罪的“运动”,警方将恢复在该市的巡逻。很快,一群“不熟练”的小偷就会被抓住。我们抓到那些没有技术技能的小偷的原因是警察也没有技术。在抓到一群低端小偷后,还不清楚这个城市的治安水平是如何变化的,但是很明显,这个城市的小偷的平均水平已经大大提高了。

警察开始继续训练他们的调查技术,并开始抓捕那些越来越狡猾的小偷。随着这些职业惯犯的被捕,警察也发展了特殊技能。他们能很快从一群人中找到可疑的人,所以他们上前询问并最终逮捕嫌疑犯。小偷也过得很艰难,因为警察大大提高了他们的标准。如果他们仍然像以前那样偷偷摸?呛芸炀突岜痪熳プ ?

为了避免被捕,小偷们尽量表现得不那么“可疑”,而魔鬼比他们高一英尺,而陶比他们高十英尺。警察也在不断提高他们的水平,试图把小偷和无辜的普通人区分开来。有了警察和小偷之间的这种“交流”和“讨论”,小偷变得非常谨慎。他们有极高的偷窃技巧,行为举止完全像普通人。警方都开发了“金眼睛”。一旦发现可疑的人,他们可以立即发现并及时控制他们最后,我们有最强的小偷和最强的警察。

生成对抗网络(GAN)由两个重要部分组成:

生成器:通过机器生成数据(主要是图像),以便“愚弄”鉴别器

鉴别器:判断该图像是真实的还是机器生成的。目的是找出第一阶段发生器

产生的“假数据”:固定“鉴别器d”并训练“发生器g”

我们使用一个返回的“确定”鉴别器使“发生器g”连续产生“假数据”,然后给“鉴别器d”判断。

起初,发电机G很弱,所以很容易发现。

但随着不断的训练,“生成者G”的技能不断提高,最终欺骗了“鉴别者D”。

此时,“鉴别器D”基本上处于猜测状态,判断它是否是错误数据的概率为50%。

second stage:fix " generator g "并训练" discriminator d"

通过第一阶段后,继续训练" generator g "是没有意义的。这时,我们固定了“发电机g”,并开始训练“鉴别器d”。

“鉴别器D”通过不断的?盗诽岣吡怂募鹉芰Γ钪账梢宰既返嘏卸纤械募偻计?

此时,生成器G不能再愚弄鉴别器D了。

循环第一阶段和第二阶段

通过连续循环,“发生器G”和“鉴别器D”的能力越来越强。

最后,我们得到了一个非常好的“生成器G”,我们可以用它来生成我们想要的图片。

可以更好地模拟数据分布(更清晰的图像)。

理论上,遗传神经网络可以训练任何类型的发电机网络。其他框架要求生成器网络具有一些特定的功能形式,例如,输出层是高斯的。

不需要使用马尔可夫链重复采样,不需要在学习过程中进行推断,不需要复杂的变异下界,避免了近似计算困难概率的难题。

难以训练且不稳定。发生器和鉴别器需要良好的同步,但在实际训练中,D容易收敛,G容易发散。驾驶员培训需要精心设计。

模式折叠问题。遗传神经网络的学习过程可能导致模式缺失,发生器开始退化,总是产生相同的样本点,从而无法继续学习。

(4)gan算法

如果你对gan算法感兴趣,你可以在GAN动物园看到几乎所有的算法。

(5)gan

人工智能训练的实际应用需要大量的数据集。如果所有的数据都是手工收集和标记的,成本会非常高。GAN可以自动生成一些数据集来提供低成本的训练数据。

简单地说,将一种图像转换成另一种图像就像添加滤镜一样神奇。

??2016年的一篇名为“StackGAN:从文本合成使用StackGAN到真实照片”的论文中,演示了如何使用GAN,尤其是它们的StackGAN,从简单对象(如鸟和花)的文本描述生成真实照片。

在2017年题为“姿势引导人类形象生成”的论文中,人体模型可以自动生成,并且可以使用新的姿势。

GANs可以从面部照片中自动生成相应的表情。

给出一张脸部照片,GAN可以帮助你预测不同年龄的你会是什么样子。

给GAN一张照片,他可以生成更高分辨率的照片,使照片更清晰。

如果照片中的某个区域有问题(例如被着色或擦除),GAN可以修复该区域并将其恢复到原始状态。

可以通过从不同角度提供2D图像来生成3D模型。

4强化学习-强化学习| RL

(1)什么是强化学习

强化学习不是一个特定的算法,而是一类算法的统称。

强化学习算法的思想非常简单。以游戏为例。如果在游戏中采用了某种策略,并且可以获得更高的分数,那么该策略将被进一步“强化”,以便继续获得更好的结果。这个策略非常类似于日常生活中的各种“绩效奖励”。我们经常使用这个策略来提高我们的游戏水平。

在Flappy bird中,我们需要一个简单的点击操作来控制小鸟,避开各种管道,尽可能飞得远,因为我们飞得越远,奖励点数就越高。

这是一个典型的强化学习场景:

机器有一个明确的鸟的角色-代理人

需要控制鸟飞得更远-目标

需要在整个游戏过程中避开各种水管-环境

避开水管的方法是让鸟飞得更硬-避开水管的方法是让鸟飞得更硬-动作

避开水管的方法是让鸟飞得更硬-避开水管的方法是让鸟飞得更硬-动作

(2)强化学习的主流算法

2类强化学习算法。这两种分类之间的重要区别在于:代理是否能够完全理解或学习环境的模型

基于模型的,它具有环境的高级知识并且能够预先考虑规划,但是缺点是如果模型与现实世界不一致,它在实际使用场景中将不能很好地执行。

Model-Free放弃了模型学习,效率不如前者,但是这种方法更容易实现,并且可以很容易地调整到真实场景中的良好状态。因此,无模型学习方法更受欢迎,并得到了更广泛的开发和测试。