联系我们

AI 101.

什么是机器学习?

mm

更新

 on

机器学习是最快的生长技术领域之一,但尽管“机器学习”的速度繁殖了多久,但很难理解机器学习,精确。

机器学习它不提到一件事’S可以应用于许多不同概念和技术的伞术语。了解机器学习意味着熟悉不同形式的模型分析,变量和算法。让我们仔细看看机器学习,更好地了解它包含的内容。

什么是机器学习?

虽然术语机器学习可以应用于许多不同的东西,但是,术语是指使计算机能够在不接收到明确的逐行指令来执行任务的情况下执行任务。机器学习专家不必写出解决问题所需的所有步骤,因为计算机能够通过分析数据内的模式并将这些模式概括为新数据来“学习”。

机器学习系统有三个基本部分:

  • 输入
  • 算法
  • 输出

输入是进入机器学习系统的数据,并且输入数据可以分为标签和功能。功能是相关变量,将分析的变量来学习模式并得出结论。同时,标签是给予数据的各个实例的类/描述。

功能和标签可用于两种不同类型的机器学习问题:监督学习无人监督的学习.

无人育的与监督学习

监督学习,输入数据伴随着地面真理。监督学习问题具有正确的输出值作为数据集的一部分,因此预期的类预先已知。这使得数据科学家可以通过在测试数据集上测试数据来检查算法的性能,并看到正确分类的项目百分比是多少。

相比之下,无人监督的学习问题没有接受地面真理标签。培训的机器学习算法用于执行无监督的学习任务,必须能够为自己推断数据中的相关模式。

监督学习算法通常用于分类问题,其中一个有一个大型数据集,其中包含必须排序到许多不同类别中的实例。另一种类型的监督学习是一个回归任务,其中算法的值输出是连续的,而不是分类。

同时,无监督的学习算法用于如密度估计,聚类和表示学习等任务。这三个任务需要机器学习模型来推断数据的结构,没有给出模型的预定义类。

让我们简要介绍一个在无监督学习和监督学习中使用的一些最常见的算法。

监督学习的类型

常见的监督学习算法包括:

支持矢量机器是将数据集分成不同类的算法。数据点通过绘制从彼此分隔类的行分组为群集。在线一侧发现的点属于一个类,而行的另一侧的点是不同的类。支持向量机旨在最大化线路之间的距离和在线两侧发现的点,距离越多,分类器的距离就越多于该点属于一个类而不是另一个类。

物流回归当数据点需要被归类为属于两个类之一时,它是二进制分类任务的算法。 Logistic回归通过标记数据点A 1或A 0.如果数据点的感知值为0.49或更低,则将其归类为0,而如果它是0.5或更高,则其被分类为1。

决策树算法通过将数据集分成更小和更小的碎片来操作。用于划分数据的确切标准取决于机器学习工程师,但目标是最终将数据划分为单个数据点,然后将使用键进行分类。

随机森林算法基本上是许多单一的决策树分类器链接在一起进入更强大的分类器。

天真的贝叶斯分类器计算基于事先发生的概率发生给定数据点的概率。它是基于的贝叶斯定理并且它根据计算概率将数据点放入类中。在实现天真贝叶斯分类器时,假设所有预测因子对类结果具有相同的影响。

一个人工神经网络或者是Multi-Layer Perceptron,是由人脑的结构和功能的机器学习算法。人工神经网络从众多节点/神经元组合在一起的事实中获取他们的名字。每个神经元都以数学函数操纵数据。在人工神经网络中,有输入层,隐藏层和输出层。

神经网络的隐藏层是数据实际解释和分析模式的位置。换句话说,它是算法学习的地方。更多的神经元连接在一起制作更复杂的网络,能够学习更复杂的模式。

无监督学习的类型

无监督的学习算法包括:

  • k-means聚类
  • autoencoders.
  • 主要成分分析

k-means聚类是一种无人监督的分类技术,它通过将数据点分离为基于其特征的集群或组。 K-Means群集分析数据点中的特征,并区分它们中的模式,使得在给定的类群集中的数据点比彼此更相似,而不是它们是包含其他数据点的群集。这是通过将可能的集群或质心在数据的图表中安置可能的中心来实现,并重新分配质心的位置,直到找到一个位置,以最小化质心和属于该中心类的点之间的距离。研究人员可以指定所需的簇数。

主要成分分析是一种技术,可将大量特征/变量降低到较小的特征空间/较少的功能中。选择数据点的“主组件”以保存,而其他功能被挤压成较小的表示。保留原始数据脓液之间的关系,但由于数据点的复杂性更简单,因此数据更容易量化和描述。

autoencoders.是神经网络的版本,可以应用于无监督的学习任务。 AutoEncoders能够采用未标记的自由形式数据并将其转换为神经网络能够使用的数据,基本上创建了自己标记的培训数据。 AutoEncoder的目标是将输入数据转换并尽可能准确地重建它,因此它’在网络的激励下,确定哪些功能是最重要的并提取它们。

Blogger和Programmer有专业的机器学习深度学习话题。丹尼尔希望帮助别人利用AI的力量来社交。