联系我们

人工智能 101

什么是深度学习?

mm

更新

 on

深度学习是人工智能领域中最具影响力和发展最快的领域之一。但是,由于深度学习一词涵盖了各种不同的算法和技术,因此很难直观地了解深度学习。深度学习还是以下领域的子学科 机器学习 一般来说,所以’了解什么是机器学习对理解深度学习很重要。

什么是机器学习?

深度学习 是机器学习起源的一些概念的扩展,因此,让我们花一点时间来解释什么是机器学习。

简而言之,机器学习是一种使计算机能够执行特定任务而无需显式编码用于完成这些任务的算法的每一行的方法。机器学习算法有很多,但是最常用的算法之一是 多层感知器。多层感知器也称为神经网络,它由链接在一起的一系列节点/神经元组成。多层感知器中包含三个不同的层:输入层,隐藏层和输出层。

输入层将数据带入网络,然后由中间/隐藏层中的节点对其进行操作。隐藏层中的节点是数学函数,可以操纵来自输入层的数据,并从输入数据中提取相关模式。这就是神经网络“学习”的方式。神经网络之所以得名,是因为它们受到人脑的结构和功能的启发。

网络中节点之间的连接具有称为权重的值。这些值实质上是关于一层中的数据与下一层中的数据如何相关的假设。随着网络的训练,权重被调整,目标是关于数据的权重/假设最终将收敛于准确表示数据中有意义模式的值。

激活功能存在于网络的节点中,这些激活功能以非线性方式转换数据,使网络能够学习数据的复杂表示形式。激活函数将输入值乘以权重值并添加一个偏差项。

什么是深度学习?

深度学习是将多个多层感知器连接在一起的机器学习架构的术语,因此不仅有一个隐藏层,而且有许多隐藏层。深度神经网络越“深入”,网络可以学习的模式越复杂。

由神经元组成的深层网络有时称为完全连接网络或完全连接层,是指给定神经元保持与其周围所有神经元的连接这一事实。完全连接的网络可以与其他机器学习功能结合使用,以创建不同的深度学习架构。

不同类型的深度学习

研究人员和工程师使用各种深度学习架构,并且每种不同的架构都有其自己的特殊用例。

卷积神经网络

卷积神经网络或CNN是创建以下内容时常用的神经网络架构 计算机视觉 系统。卷积神经网络的结构使它们能够解释图像数据,并将其转换为完全连接的网络可以解释的数字。 CNN有四个主要组成部分:

  • 卷积层
  • 二次采样/池化层
  • 激活功能
  • 全连接层

卷积层是将图像作为网络输入的内容,分析图像并获取像素值。子采样或合并是图像值的转换/减少,以简化图像的表示并降低图像滤波器对噪声的敏感度。激活功能控制数据如何从一层流到下一层,而完全连接的层则是分析代表图像的值并学习这些值中保持的图案的功能。

神经网络 / LSTM

递归神经网络或RNN,在数据顺序很重要,网络必须了解数据序列的任务中很流行。 神经网络通常适用于诸如 自然语言处理,因为单词的顺序在解码句子的含义时很重要。递归神经网络一词的“递归”部分来自这样一个事实,即序列中给定元素的输出取决于先前的计算以及当前的计算。与其他形式的深度神经网络不同,RNN具有“内存”,并且使用序列中不同时间步长计算出的信息来计算最终值。

神经网络有多种类型,包括双向RNN,在计算项目值时,除了以前的项目外,它们还考虑序列中的将来项目。另一种 神经网络 是一个 长短期记忆或LSTM,网络。 LSTM是可以处理长数据链的RNN类型。常规RNN可能会成为“爆炸梯度问题”的受害者。当输入数据链变得非常长时会发生此问题,但LSTM具有解决此问题的技术。

自动编码器

到目前为止提到的大多数深度学习架构都适用于 监督学习 问题,而不是 无监督学习 任务。自动编码器能够将非监督数据转换为监督格式,从而允许在问题上使用神经网络。

自动编码器 通常用于检测数据集中的异常情况,这是一个无监督学习的示例,因为该异常的性质尚不清楚。异常检测的此类示例包括针对金融机构的欺诈检测。在这种情况下,自动编码器的目的是确定数据中规则模式的基线并识别异常或异常值。

自动编码器的结构通常是对称的,其中隐藏层的排列方式使网络的输出类似于输入。经常使用的四种自动编码器类型是:

  • 常规/普通自动编码器
  • 多层编码器
  • 卷积编码器
  • 正则编码器

常规/普通自动编码器只是具有单个隐藏层的神经网络,而多层自动编码器是具有多个隐藏层的深度网络。卷积自动编码器使用卷积层代替全连接层,或在全连接层之外使用卷积层。正规化的自动编码器使用一种特殊的损失函数,该函数使神经网络执行更复杂的功能,而不仅仅是将输入复制到输出。

生成对抗网络

生成对抗网络(GAN) 实际上是多个深度神经网络,而不仅仅是一个网络。同时训练两个深度学习模型,并将它们的输出反馈到另一个网络。这些网络相互竞争,并且由于它们可以相互访问’的输出数据,他们都从该数据中学习并改进。这两个网络本质上在打假钞和侦查游戏,其中生成模型试图创建新的实例,以欺骗侦探模型/鉴别器。 GAN已在计算机视觉领域变得流行。

深度学习总结

深度学习扩展了神经网络的原理,以创建复杂的模型,该模型可以学习复杂的模式并将这些模式概括为未来的数据集。卷积神经网络用于解释图像,而RNN / LSTM用于解释顺序数据。自动编码器可以将无监督的学习任务转换为有监督的学习任务。最后,GAN是相互竞争的多个网络,对于计算机视觉任务特别有用。

专门从事以下工作的Blogger和程序员 机器学习 深度学习 话题。 Daniel希望帮助他人将AI的力量用于社会公益。