联系我们

AI 101.

12博下载app分类如何工作?

mm

更新

 on

如何通过拍摄照片来确定对象的内容是什么?社交媒体网站如何自动标记照片中的人?这是通过AI供电的12博下载app识别和分类来实现的。

12博下载app的认可和分类是使人工智能最令人印象深刻的成就。然而,计算机如何学会检测和分类12博下载app?在本文中,我们将介绍计算机用于解释和检测12博下载app的一般方法,然后看看一些分类这些12博下载app的一些最流行的方法。

像素级与对象的分类

12博下载app分类技术可以主要分为两种不同的类别:基于像素的分类基于对象的分类。

像素是12博下载app的基本单元,并且像素的分析是12博下载app分类的主要方式。然而,分类算法可以仅使用各个像素内的光谱信息来分类12博下载app或检查空间信息(附近像素)以及光谱信息。基于像素的分类方法仅利用频谱信息(像素的强度),而基于对象的分类方法考虑了像素光谱信息和空间信息。

用于基于像素的分类存在不同的分类技术。这些包括最小距离到均值,最大可能性和最小哈拉诺波距离。这些方法要求众所周知,通过检查类装置和目标像素之间的“距离”来操作它们全部操作。

基于像素的分类方法受到从其他附近像素中的信息使用信息的限制。相反,基于对象的分类方法可以包括其他像素,因此它们还使用空间信息来对项目进行分类。注意,“对象”刚参考像素的连续区域,而不是在该区域中是否存在目标对象。

用于对象检测的预处理12博下载app数据

最新可靠的12博下载app分类系统主要使用对象级分类方案,对于这些方法,必须以特定方式准备12博下载app数据。需要选择和预处理对象/区域。

在12博下载app之前和该12博下载app内的对象/区域,可以分类包括该12博下载app的数据由计算机解释的数据。12博下载app需要预处理并被读取输入分类算法,这是通过对象检测完成的。这是准备数据并准备培训12博下载app的关键部分机器学习分类器。

对象检测完成各种方法和技术。首先,是否有多个感兴趣的对象或一个感兴趣的对象会影响12博下载app预处理是如何处理的。如果只有一个感兴趣的对象,则12博下载app会经历12博下载app本地化。包括12博下载app的像素具有由计算机解释并用于显示适当颜色和色调的数值。被称为边界框的对象围绕感兴趣的对象绘制,这有助于计算机知道12博下载app的一部分重要性以及像素值定义对象的哪些像素。如果12博下载app中有多个感兴趣的对象,则使用一种称为对象检测的技术来将这些边界框应用于12博下载app内的所有对象。

Photo: Adrian Rosebrock via Wikimedia Commons, CC BY SA 4.0 (//commons.wikimedia.org/wiki/File:Intersection_over_Union_-_object_detection_bounding_boxes.jpg)

预处理的另一种方法是12博下载app分割。通过将整个12博下载app划分为基于类似的特征来将整个12博下载app划分为段的12博下载app分割功能。与12博下载app的其他区域相比,12博下载app的不同区域将具有类似的像素值,因此这些像素被分组成对应于12博下载app内相关对象的形状和边界的12博下载app掩模。12博下载app分段有助于计算机隔离12博下载app的特征,这些12博下载app将有助于对对象进行分类,如边界框,但它们提供更准确的像素级标签。

在对象检测或12博下载app分割完成之后,标签应用于所讨论的区域。将这些标签携带,以及包括对象的像素的值,进入机器学习算法,该算法将学习与不同标签相关联的模式。

机器学习算法

一旦数据准备和标记,数据被馈送到机器学习算法中,该算法在数据上列车。我们将涵盖一些最常见的机器学习12博下载app分类算法以下。

k - 最近邻居

K-Collect邻居是一种分类算法,它检查最接近的训练示例,并查看其标签以确定给定测试示例的最可能标签。当涉及使用KNN的12博下载app分类时,存储训练12博下载app的特征向量和标签并仅在测试期间将特征向量传递到算法中。然后将训练和测试特征向量与相似性相互比较。

基于KNN的分类算法非常简单,它们很容易处理多个类。然而,KNN根据平等的所有功能计算相似度。这意味着当提供具有仅具有12博下载app的分类的特征的副本很重要的12博下载app时,可以易于错误分类。

支持矢量机器

支持向量机是一种分类方法,该分类方法将点处于空间中,然后在点之间绘制分割线,根据分割平面的哪一侧落下的位置,将物体放置在不同类别之间。支持向量机能够通过使用称为内核诀窍的技术进行非线性分类。虽然SVM分类器通常非常准确,但是对SVM分类器的实质性缺点是它们往往受到尺寸和速度的限制,速度遭受尺寸增加。

多层的感觉(神经网)

多层的感知,也称为神经网络模型,是人类大脑的机器学习算法。多层的感知由各种层组成,这些层彼此连接在一起,就像人脑中的神经元一样与众不同。神经网络假设输入功能如何与数据的类相关,并且在培训过程中调整这些假设。简单的神经网络模型,如多层的Perceptron能够学习非线性关系,因此,它们可以比其他模型更准确。然而,MLP模型遭受一些显着的问题,如存在非凸损失功能。

深度学习算法(CNNS)

Photo: APhex34 via Wikimedia Commons, CC BY SA 4.0 (//commons.wikimedia.org/wiki/File:Typical_cnn.png)

最常用的12博下载app分类算法最近的时间是卷积神经网络(CNNS)。 CNN是定制版本的神经网络,这些版本将多层神经网络与专用层组合,该专用层能够提取最重要的功能和与对象的分类相关的功能。 CNN可以自动发现,生成和学习12博下载app的功能。这大大减少了手动标签和段12博下载app以准备机器学习算法的需要。它们在MLP网络上也具有优势,因为它们可以处理非凸损耗功能。

卷积神经网络从他们创造“卷积”的事实中获取他们的名字。 CNN通过筛选过滤器并将其滑过12博下载app。您可以将此视为通过可移动的窗口查看景观的部分,专注于任何时间通过窗口可见的功能。过滤器包含数值,该值乘以像素本身的值。结果是一个新的帧或矩阵,满是代表原始12博下载app的数字。重复该过程的选择滤波器数,然后将帧连接在一起,进入略小且不复杂的新12博下载app比原始12博下载app略小。称为池的技术用于选择12博下载app内最重要的值,并且目标是卷积层最终仅提取12博下载app的最突出的部分,这将有助于神经网络识别12博下载app中的对象。

卷积神经网络由两种不同的部分组成。卷积层是提取12博下载app的特征,并将它们转换为神经网络层可以解释和学习的格式。早期的卷积层负责提取12博下载app的最基本元素,如简单的线条和边界。中间卷积层开始捕获更复杂的形状,如简单的曲线和角落。后来,更深的卷积层提取12博下载app的高级特征,这是传递到CNN的神经网络部分的内容,并且是分类器的学习。

Blogger和Programmer有专业的机器学习深度学习话题。丹尼尔希望帮助别人利用AI的力量来社交。